Nvidia NVDA 揭示与 Groq 的 200 亿美元交易以加速 AI 推理

发布于: 12 月 26, 2025
编辑: Maya Trent

Nvidia 通过一项价值 200 亿美元的协议,试图锁定 AI 最热门的领域——低延迟推理芯片制造商 Groq,在开发者圈内名声甚响。此次全现金交易为 Nvidia 有史以来最大一笔收购,结合了对 Groq 技术的非独占许可以及对创始人 Jonathan Ross、总裁 Sunny Madra 及其他关键高管的招募。GroqCloud——该创业公司的推理服务——将在新任 CEO Simon Edwards 领导下保持独立运营。Nvidia CEO Jensen Huang 将此举描述为对公司 AI 工厂战略的扩展,称:“我们计划将 Groq 的低延迟处理器整合到 NVIDIA AI factory 架构中,扩展该平台以服务更广泛的 AI 推理和实时工作负载。”

市场反应与 200 亿美元信号

单看价格就能说明问题。Nvidia 支付溢价以解决即便是其最先进 GPU 仍面临的问题:大规模实时推理的延迟与成本。训练或许将 Nvidia 的股价和数据中心收入推升至高位,但推理是超大规模云厂商和消费级 AI 应用下一轮运营成本压力最为集中的领域。200 亿美元现金支出也表明了公司信念。Nvidia 的资产负债表可以支撑此举,公司选择在硅片差异化上投入,而不仅仅是扩充容量和软件。这向客户和竞争对手传递了直接信息:Nvidia 不打算放弃 AI 堆栈的任何阵地,包括日益重要的推理层。

为什么是 Groq,为什么是现在

Groq 凭借每秒令牌吞吐量和大语言模型推理的确定性延迟建立了声誉。由 Ross 领导的团队设计的 LPU 架构——Ross 曾协助发起 Google 的 TPU 项目——针对高吞吐、低延迟工作负载进行了优化,而非单纯用于暴力训练。随着 AI 从演示转向实用,这种侧重点很重要:实时协助、搜索和具主体性的工作流不能容忍卡顿。Nvidia 最新的 GPU 可以处理推理,但某些模型的经济性和响应性更倾向于专用加速器。将 Groq 的引擎接入 Nvidia 的软件和网络生态,为客户提供了在不离开 Nvidia 生态的情况下混合选择训练算力与推理速度的路径。

看起来像收购的许可协议

表面上,该结构为非独占技术许可加上人才收购。实际上,Nvidia 正在掌握核心资产。招聘关键管理层并授权核心知识产权,同时让 GroqCloud 在独立领导下继续运营,这种安排似乎旨在降低反垄断阻力,同时确保 Nvidia 引导关键路线图。这种独立性叙事将吸引曾试验过 Groq API 的开发者,也为监管机构在平台控制与独立服务业务之间提供更清晰的界线。但实质无可掩饰:设计 Groq 芯片及其底层技术的人将进入 Nvidia 的轨道。一旦 Nvidia 开始在其 AI factory 策略中捆绑 Groq 级别的推理产品,关于“非独占”未来感受度的质疑将随之而来。

整合进 Nvidia AI factory 的路径

这并非一笔摆设性的收购;而是一次整合行动。Nvidia 可以将 Groq 的低延迟引擎嵌入 CUDA-X 软件、NIM 微服务及其从 NVLink、NVSwitch 到 Ethernet Spectrum-X 的网络堆栈。如果 Nvidia 能实现无缝模型分区——在 H100、H200 或 Blackwell 级别 GPU 上训练并在源自 Groq 的推理硅片上部署——客户将获得更紧密的闭环并可能降低总体拥有成本。BlueField DPU 可在边缘协调数据移动与安全性,而 DGX 系统则可演进为为实时工作负载调优的异构节点。奖赏是黏性的整个平台份额:Nvidia 在其堆栈中使推理经济性越是开箱即用,企业就越难为并行供应商路线找到正当理由。

赢家、输家与超大规模云厂商的权衡

AMD 和 Intel 面临更加尖锐的竞争。AMD 的 MI300 系列在训练和推理方面已取得进展,而 Intel 正推动 Gaudi 和附加于 CPU 的推理以服务成本敏感型部署。Groq 的技术进入 Nvidia 的分销机器,可能会吸引开发者注意力并将采购动能重新导向现有龙头。超大规模云厂商——AWS、Microsoft、Google——会做出自己的计算。他们正争相降低嵌入于搜索、生产力套件和电商中的 AI 助手的单位成本与延迟。Nvidia 的举动既提供了性能故事和简化采购的方案,也加深了对单一供应商的依赖。预计云提供商将在定价和供给承诺上进行强硬谈判,同时继续投资自己的替代硅片与软件堆栈以保持筹码。对于没有超大规模云预算的企业而言,能够提供确定性推理的统一 Nvidia 解决方案可能是简单的选择按钮。

监管风险仍在桌面上

将交易结构化为许可加人才收购,是对更严峻并购气候的回应,尤其是在 Nvidia 在监管压力下放弃 ARM 收购之后。FTC、司法部和欧洲监管机构将透过形式看功能。关键问题包括:该交易是否减少了新兴 AI 加速器,尤其是推理领域的竞争?Nvidia 对关键 IP 的控制是否会通过在 CUDA 和其云市场中捆绑而排斥竞争对手?Nvidia 已通过使用“非独占”字眼并将 GroqCloud 留在外围来预先构建其论点,这一姿态暗示必要时可采取行为性救济措施。然而,单是人才转移就可能足以触发更深入的调查,鉴于专用推理市场仍处于早期。公司必须在整合速度与维护开放竞争可信路径的形象之间找到平衡。

关于利润率和单位经济学的计算

如果 Nvidia 能在其 AI factory 中标准化 Groq 级别的推理,它可能保护甚至提升数据中心利润率。规模化推理是 CFO 每月审视的预算项。降低每次查询成本同时改善延迟,直接影响云 AI 服务的客户净留存率。Nvidia 的收益不仅来自硬件,还来自软件、网络和服务层面的附加率。相反,整合一项不同的架构也带来执行风险。工具链、编译器和开发者工作流需要感觉原生。如果摩擦高,客户会坚持 GPU 唯一路线或更倾向于竞争对手提供的 CPU 与 NPU 混合方案。Nvidia 发布 SDK、工具和参考设计的速度将决定这笔 200 亿美元支出能否在 2026 财年转化为收入拉动。

接下来需要关注的事项

三个里程碑将决定基调。首先,公开路线图要显示 Groq 的 IP 如何落入 Nvidia 的产品线——是以独立卡、集成模块进入 DGX,还是以合作云服务形式出现。第二,需有证据表明顶级客户正在将对延迟敏感的工作负载迁移到合并后的堆栈,且没有性能倒退或开发者痛点。第三,监管态度。一个早期、积极的访问与互操作性框架可能避免最严厉的救济措施。同时关注人才留存。让 Ross、Madra 及关键架构师在多个产品周期内保持参与,比任何头条都更为重要。竞争对手的回应应当迅速:AMD 将强调推理的总体拥有成本,Intel 将争取成本意识强的买家,云提供商将加速自身硅片故事。AI 的重心正从训练的吹嘘权重向大规模推理转移。Nvidia 刚刚花钱确保这一转移在其平台上发生。

人工智能 清洁能源