FT:我们造出了一个怪物--随着成本挤压预算,企业纷纷收紧人工智能的使用
token费用大增,让美国AI泡沫出现了说不圆的裂隙。现在媒体开始热烈讨论了,刚FT发了文章,总得给个说法,中国AI因为性价比优秀,浮出水面了。报道还很表面,意义是成了大事。如果要看技术含量,还是得看懂技术的人的深入讨论。
----争相将AI工具给员工的企业,开始限制了,因为成本正考验企业的预算。
亚马逊、沃尔玛、思科、优步和Meta纷纷出台额度限制、遏制浪费使用,推动员工选用更经济的模型,以期合理控制AI支出。
企业AI应用进入新阶段。员工从聊天机器人转向能自主执行复杂任务的Agent,所需算力远超前者,企业不得不审慎评估成本投入是否值得。
Anthropic和OpenAI等多家机构将部分服务的收费模式,从固定订阅制调整为按token计费。企业更直接地承担每条提示词和每个自动化工作流的成本。
“如今,计算成本正进入CFO和董事会的视野。消费者和企业一直被灌输:AI要么廉价,要么免费,但事实不是如此。”德勤全球生成式AI负责人科斯蒂·佩里科斯表示。
OpenAI CEO奥特曼本月表示,成本已成为客户的“重大问题”。“去年根本没人提……大家对自己花的钱都很满意。”
优步总裁安德鲁·麦克唐纳表示,公司token支出正变得“越来越难以说通”。他近期在播客节目中称:“很难在数据指标与‘好吧,我们现在能多产出约25%的实用型消费者功能’之间划出一条清晰界限。”
这家网约车公司已推出额度上限,员工在单个AI工具上的月度token支出不得超过1500美元,此前公司已于4月耗尽了2026全年AI预算。
沃尔玛也通过限制员工token数量,对内部AI的使用进行了类似限制。沃尔玛全球CTO苏雷什·库马尔表示,公司旗下Code Puppy趣味编程平台的使用量“大幅飙升”。他指出:“这是我们静下心来、重新审视自身的机会”,并补充称,员工正被赋予一项重要任务——为各项任务甄选合适工具。
思科公司总裁吉图·帕特尔表示,企业不得不在部署agent的需求与token成本之间寻求平衡。“与聊天机器人比,agent的基础设施投入要高得多,”帕特尔表示,“对一名真人客服,你可能需要10名、100名,甚至在更激进的情况下需要1000个agent……”“它们只是不停地工作,消耗掉一大部分[计算资源]。”
高盛分析师上月预测,到2030年,AI Agent的使用将使token消耗量增加24倍,而需求的大幅增长将在未来12至18个月内加剧芯片短缺。
尽管企业对生成式AI的使用和支出持续增长,但控制成本的努力可能会拖累Anthropic、OpenAI的扩张步伐,它们计划于今年以接近万亿美元的估值上市。
聚合平台OpenRouter的数据显示,自年初以来,中国大模型在token消耗量上已超过美国同行。
中国更廉价的能源与更高效的模型,使中国AI能收取更低费用,远低于美国顶尖机构的token价格,为中国在AI竞争中赢得新优势。
小型企业也正感受到成本压力。软件公司Workato表示,去年夏天1300名员工开始使用AI智能体,井喷式增长。“趋势迅速蔓延,员工们纷纷借助agent彻底重塑自己的工作流方式,”首席信息官卡特·巴斯表示。
然而,当Anthropic在5月改为token数量定价时,公司大吃一惊。“我们第一天的支出就飙升了7倍,我当时心想:糟糕,我们养了个‘怪物’,”巴斯表示。“大模型公司此前一直补贴用量,而现在不补了。”“基于用户的定价能保护您。”
巴斯正在努力控制支出,而非限制访问,将每周两次的 AI 技术赋能会议调整为推广节支方案,如默认使用 Anthropic较老的低成本模型。他说:“与其谈创新,不如谈谈 AI的财务责任。”
大型企业也已开始调整与AI应用相关的激励机制和内部沟通策略。
亚马逊上月警告员工,停止“为用而用AI”,此前有工程师为内部排行榜而滥用Agent。集团被迫调整AI采纳率的方式,控制滥用成本。Meta也在四月采取了类似举措。亚马逊和Meta有自有模型,但也依赖第三方,如Anthropic,用Claude Code等模型与工具。
AI团体和平台正试图引导用户,在非必要时避开昂贵的前沿模型,用经济实惠的版本维持其普及度。
GitHub的COO凯尔·戴格尔表示,微软在定价调整之前已与客户沟通,就“适用性与目的”与开发者进行了讨论。“对用户而言,问题在于:‘哪些模型最适合这项任务?’”。 他补充道,“你并不总是需要寻找最前沿的模型。”
微软及其他云平台,包括亚马逊和谷歌,均已推出相关工具,将客户的查询与任务路由至一系列模型中最匹配的那个,更有效地控制成本。
同时,一些企业要求员工,使用在自有服务器或个人设备上本地运行的开源模型,降低向大模型公司和云服务提供商支付的费用。
然而,客户仍在权衡更高的成本与他们向投资者所作出的承诺——即AI对其自身盈利能力和员工生产力的影响。
“我们的工程师想要更多token……我们必须想出办法来为其提供资金,”思科的帕特尔表示。
