Palantir 的 Alex Karp 在电视直播中点燃了 AI 成本辩论,指责前沿实验室推动一种“他妈的疯狂”的基于 token 计费的模型,掏空企业预算并抽取专有优势。时机很重要:CIO 正在重新评估 AI 支出,监管者逐渐介入,成本缓解正在向更便宜的开放权重替代品集中——许多来自中国。Karp 把这场反弹框定为商业层面的反抗,而非文化战争,并以一份主权宣言和与 Nvidia 更深的合作为后盾,主张对算力、数据和模型权重的控制是唯一可辩护的道路。
Karp 的核心主张很简单:企业不想被困在别人的 API 计量表内。他们想要可预测的单位经济学以及对那些复合其优势的要素的控制——数据、工作流和模型权重。他认为基于 token 的定价会扭曲激励。它鼓励“token 最大化”、一次性脚本和无法转化为持久生产力提升的头条演示。这在软件领域是一个熟悉的模式:当定价与活动挂钩而非价值时,活动会爆炸而价值滞后。
随着按使用量计费的 AI 账单持续上升而 ROI 仍不稳定,这种批评切中要害。在许多企业里,第一波试点交付了令人印象深刻的原型,但投产提升较慢,安全、延迟和数据治理摩擦增加了隐性成本。Karp 称其为对机构 alpha 的“财富税”。这句话尖锐,但逻辑成立:如果你的模型及其权重更新不在你的控制之下,你就在向供应商训练使你独特的东西,然后以越来越高的边际成本把它租回给自己。
Palantir 的九点“AI 主权”备忘录读起来像 2026 年采购周期的买家指南:拥有你的数据管道,拥有你的权重,避免技术政治化架构,并衡量结果而非 token。言辞背后是一种押注:企业 AI 的重心将从单一最佳模型转向运行最佳的系统——定制化堆栈,融合开放权重、专有微调、检索层和受保护的集成。
这种转变也关乎责任和韧性。董事会在问敏感数据存放何处,谁能重构专有权重,以及第三方模型在更新后行为政策改变时会发生什么。工作负载越是战略性——比如受监管行业和国防——这些问题就越成为门槛。Karp 的国家安全论调,“我们真的要把战场外包给硅谷的共识观点吗?”呼应了这种紧迫感。它也推销了 Palantir 的公司观点:运营化 AI 在成为模型排行榜问题之前,是一个系统集成问题。
今天的成本压力出口是开放权重替代品,包括中国模型。Microsoft 已探索为 Copilot 工作负载托管并微调 DeepSeek V4 的 Microsoft 托管版本,同时其收费策略向基于使用量倾斜。Coinbase 通过将常见任务路由到像 GLM 5.2 和 Kimi 这样的开放权重中国模型,几乎将内部 AI 支出削减了一半,并且没有限制使用量。开发者工具也在做同样的事;Cursor 在 Kimi K2.5 之上构建了 Composer 2。聚合器显示中国权重的份额增长,有时在按 token 计的顶级模型中占比超过 60%。
这对美国实验室来说是不舒服的部分:当你的毛利模式依赖于 token,而你的客户可以将长尾查询重定向到更便宜的“足够好”引擎时,替代风险是直接的。出口规则和信任壁垒很重要,尤其在公共部门,但成本引力很强。最可能的结果是更多的双轨架构:前沿用于难题,开放权重用于其他用途。这会缩小计量 API 的 TAM,并奖励那些帮助客户编排两者的供应商。
Karp 的答案是在基础设施层面应对成本和控制,指向 Palantir 与 Nvidia 扩大的合作。其主张是:主权部署,客户锁定算力、数据和权重,供应商在结果和安全边界上竞争,而不是在 token 吞吐量上竞争。对 Nvidia 来说,这与其已经进行的企业转向一致。除大型云厂外,增长点在于私有集群、本地加速卡和托管主权堆栈。如果客户把更多推理带回本地,NVDA 仍然出售硅芯片、网络产品和连接这些组件的软件。
这并非无利害关系的哲学论述。Palantir 正是出售在多模型、混合本地与云世界中变得关键的集成与治理层。Karp 在推销自家产品——并向投资者示意,随着预算回归常态,边际企业资金将流向何处:编排、数据安全和可验证的 ROI。如果你相信生成式 AI 现在进入了运营化阶段,这个论点是可信的。
前沿实验室面临两线作战:训练和服务成本持续上升,而客户则将边际查询下拨到更便宜的模型。降价可以保卫市场份额,但会压缩单位经济学。提升企业价值需要更深入地进入垂直解决方案——能移动资金、安排工作并关闭工单的 agent。但这些客户也想要控制权和可审计性。Anthropic 和 OpenAI 可以通过本地部署选项、专用容量、模型定制化和更严格的数据隔离来应对。这使它们更偏向于成为平台,而不仅仅是 API,并将它们拉近到 Palantir 想要掌控的问题上。
信息传递风险也是真实存在的。供应商在一边警告灾难性风险同时又大规模出售相同能力时,企业会犹豫。Karp 指出了这种矛盾。解决办法不是淡化风险,而是把治理变成 CIO 可以验证并为之定价的功能。能够证明稳定政策、可复现输出和有据可查数据处理的供应商会赢得预算续签。
对 PLTR 来说,如果市场从追逐模型转向系统化支出,其格局是有利的。胜利将表现为与可衡量的运营提升和降低的单位成本相关的多年扩张。对 NVDA 来说,主权并非威胁而是一个渠道;每一次把推理本地化的举措都是买更多加速器和网络设备的理由,前提是软件能满足企业需求。对 MSFT 而言,在质量允许的地方替换为更便宜的引擎是对 Copilot 的理性利润防御——并提醒人们公司的护城河是分发和集成,而不是任何单一模型。
买方一侧是这个故事最终的解决点。关注有多少大企业公开将双轨堆栈标准化。跟踪采购语言是否从 token 折扣转向基于结果的 SLA。注意捆绑着数据驻留和模型权重控制的本地或主权云公告的节奏。如果这些信号加速,Karp 的“美国商界之声”读起来就不那么像愤怒,更像下一条基线。
监管逆风将放大这些选择。数据传输规则、AI 安全制度和出口管制会影响模型能在哪里运行以及能从何处学习。如果合规成本上升,主权架构将不仅仅是偏好而是必需。地缘政治在中国套利上叠加风险;一些行业即使不考虑成本也绝不会使用中国权重。这会把需求引导到西方的开放权重生态,并给予那些能证明链路完整性和抗篡改能力的供应商优势。
这并不意味着前沿实验室会消失。意味着它们必须从计量奇迹转变为具有可信成本控制和透明治理的企业平台。Karp 加速了这场讨论。接下来需要关注的并非排行榜更新;而是预算条目、合同结构,以及究竟是谁控制那些决定企业 alpha 去向的权重。在这个市场上,控制不是一个宣传点。它就是产品。