自ChatGPT发布三年以来,全球对加速计算的需求呈爆炸式增长。英伟达(NVDA)的年收入从2022年的270亿美元飙升至2025年的2160亿美元,增幅近8倍,市场预期2026年将再增62%,达到3500亿美元。与之相应,全球数据中心系统投资的增速已从过去十年间的年均5%跃升至近三年的30%,预计2026年将再增长超30%,总额达6530亿美元。ARK研究显示,由GPU和AI专用集成电路驱动的加速计算已占据服务器销售额的86%,成为主导。
推动AI基础设施支出持续增长的动力,源于生成式AI在消费端与企业端场景的不断拓展,以及对“超级智能”的持续探索。与此同时,成本正急速下降:AI训练成本每年降低75%,而推理成本的年化降幅更是高达95%。这得益于硬件性能的代际提升与软件算法的持续改进,二者共同大幅降低了AI应用的准入门槛。
消费者接纳AI的速度远超当年互联网,普及率在三年内扩展至约20%,速度是互联网的两倍以上。企业需求同样惊人,自2024年12月以来,token需求增长了28倍。过去两年间,备受企业青睐的AI实验室Anthropic营收从1亿美元激增至近100亿美元,其2026年增势不减,年化收入已达140亿美元。另一巨头OpenAI的企业客户数已超100万,其首席财务官透露,企业业务增速已超越消费者业务,预计2026年将贡献总营收的半壁江山。为满足强劲需求,大规模基础设施投资势在必行。
在AI资本支出的核心——计算芯片领域,英伟达虽处前沿,但挑战者正不断涌现。美国超微公司(AMD)凭借EPYC处理器,在服务器CPU市场的份额已从2017年的近乎为零增长至2025年的40%。在小型模型推理方面,AMD的GPU在总拥有成本上已与英伟达旗鼓相当,但英伟达凭借其机架级解决方案Grace Blackwell,在大型模型性能上仍保持显著领先。
与此同时,超大规模云厂商正通过自研芯片寻求成本优势。谷歌(GOOGL)自研的TPU据估算可将计算成本降低62%。亚马逊的Trainium芯片、微软的Maia系列也纷纷入局。博通(AVGO)则主导了定制芯片的后端设计服务,成为谷歌、Meta及OpenAI等公司的重要合作伙伴。此外,Cerebras、Groq等芯片初创公司也凭借创新的架构范式,成为挑战现有市场格局的潜在力量。
展望未来,ARK研究预测,持续增长的需求与不断提升的性能将推动AI基础设施支出在五年内增长两倍,从2025年的5000亿美元增至2030年的近1.5万亿美元。随着AI算力需求持续攀升,针对特定工作负载设计的定制芯片将凭借更高的每美元性能优势,在计算支出中的占比不断提升,预计到2030年可能超过三分之一。
当前进行的基础设施建设并非泡沫,而是一次千载难逢的平台级变革。未来五年,能够设计出最高效芯片、构建最强大模型并实现大规模部署的企业,将在这场变革中脱颖而出。