AI词元成本高企,优步与微软被迫重新评估策略

智能计算 时间:2026-05-29来源:

随着智能体式编码工具与企业级 AI 工作流,将词元(Token)使用从简单提示拓展至长周期、多步骤的推理任务,AI 词元成本已不再是可忽略的小数目。

高盛研究报告指出,受消费者与企业端应用普及推动,到 2030 年,智能体式 AI 或将使词元消耗量激增 24 倍,达到每月 120 万亿词元。该行本月早些时候发布的分析认为,若推理成本降幅持续快于需求增速,这一趋势或将改善超大规模云厂商与模型提供商的经济效益。

AI 词元成本:从行业热词到预算大头

对企业用户而言,单位成本下降并不直接等于账单金额减少。智能体工具可反复调用模型、分析上下文、生成代码、执行校验并修正输出结果,将单次开发者请求转化为一连串消耗词元的操作。正因如此,基于词元的计费模式正成为工程团队的实际难题,而非仅局限于云基础设施领域的小众问题。

优步(Uber)是最典型的案例。有报道称,其 2026 年 AI 预算在年初数月内便已耗尽,公司正重新评估部分 AI 投入策略。优步总裁兼首席运营官安德鲁・麦克唐纳表示,目前尚未发现词元消耗量增长与面向用户的实用功能提升之间存在明确关联。这并非意味着相关工具毫无价值,而是成本与收益的平衡不再理所当然。

微软(Microsoft)内部工程团队也面临类似问题。据悉,微软计划在 6 月底前,逐步终止旗下体验与设备部门大部分内部 Claude Code 授权,引导开发者转向 GitHub Copilot 命令行工具。此外,GitHub 已宣布,从 2026 年 6 月 1 日起,Copilot 套餐将改为按使用量计费模式,GitHub AI 积分将根据输入、输出及缓存词元的总消耗量扣除。

AI 词元成本暴露硬件供需缺口

高盛的观点并非完全悲观。该行预计,通过芯片与架构优化,未来芯片供应商可将单词元推理成本每年降低 60% 至 70%;但同时也指出,未来 12 至 18 个月,受产能扩张速度滞后于 AI 新应用场景落地节奏影响,芯片供应将持续紧张。

这意味着,成本问题早已超出软件采购范畴。若智能体成为编码、客服、搜索及企业工作流自动化的主流交互方式,算力负载将重新转移至数据中心的芯片、网络、内存、存储及电力基础设施。正如《欧洲电子工程新闻》此前报道 ARM 发布数据中心 CPU 规划时所言,智能体式 AI 已成为 AI 数据中心新一代处理器战略的核心驱动力。

显而易见的教训是:企业必须以交付功能、解决客服问题、缩短工程周期或营收贡献为核心指标衡量 AI 价值,而非单纯关注词元消耗量。硬件层面的 AI 词元成本或许会持续下降,但智能体工作流的高消耗特性,往往会在财务部门看到成本优化成效前,就将节省的预算消耗殆尽。

关键词: AI 词元 优步 微软 Token

加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW

或用微信扫描左侧二维码

相关文章

查看电脑版