The GPU 壟斷現在已成為系統性風險

我們在一個不由自己掌控的晶片上建立了 AI 革命。這不是誇張，這是設計缺陷。據報導，Nvidia 新一代 Blackwell 處理器的訂單超過 360 萬片，其中大部分被最大型雲端業者鎖定。Nvidia 控制約 94% 的 GPU 市場，並且最近披露有兩位未具名客戶佔其季度營收的 39%。OpenAI 的財務長今年將沉默的部分說了出來：需求極為旺盛，而產能跟不上。AI 網格比起公共更私人化，比起分散更集中，也比投資者願意承認的更脆弱。每個人都在談論開放模型，但瓶頸不是程式碼，而是晶片的物理定律、配給的政治、以及單一供應商架構的經濟學。當算力成為瓶頸時，那隱形之手就變成了非常看得見的隊列。

算力卡特爾風險

少數公司現在事實上扮演 AI 進展的守門人。他們決定誰能租到 GPU、以什麼價格以及在何種條款下。這在法律意義上或許不是卡特爾，但結果上與之同韻。價格維持高位、供給持續緊張，沒有規模者被排除在外。這種轉變有真正的二階效應：它決定哪些研究路徑獲得資金，誰能在前緣構建系統，也會增加營運失誤的爆炸範圍。我們已見到集中化工具如何放大風險。Microsoft 自身的資安專家警告，AI 助手常繼承「穿透式」權限，暴露不該被看到的資料給員工。當算力與資料集中在同少數幾個地點時，你就是在工程化共同模式失效。一個權限錯誤便成為全公司範圍的侵害向量。Signal 的總裁去年清楚地總結了權力轉移：只有少數幾家公司能訓練並部署大規模系統，這賦予它們對機構的不成比例權力。投資者喜歡相信這種集中是暫時的，但歷史並非如此。在電力、石油與電信領域，基礎設施壟斷具有黏性，不會自行解開。需要衝擊、監管或替代浪潮。

囤積成為主導策略

在博弈論中，當資源稀缺、控制的報酬高，且競爭對手被視為可信威脅時，囤積成為主導策略。這正描述了 GPU 市場。雲端供應商預購庫存、鎖定長期供給，並以新資料中心公告互相威懾。新創預付無法完全使用的產能，以期保障生存選項。個體理性的行為造成集體非理性的結果：高峰時缺貨、低谷時浪費。這是矽晶版的牛鞭效應。心理學面向熟悉：在淘金潮中，你不會問稿鎬是否過高價；你希望下一位礦工出更高價。但算力不是軟體，它是鋼鐵、土地、電力與物流。它移動緩慢，並以群聚方式失效。通過少數幾座晶圓廠、幾家記憶體供應商與有限的先進封裝線的供應鏈，具有厚尾風險。一個故障不只是增加風險；它成倍放大。即使需求端也具相關性。若某模型突破提高推理負載，所有人的工作負載會同時飆升。當相關度高時，冗餘是神話。多雲策略仍依賴相同硬體供應商與相同上游瓶頸。這裡的機率數學並不令人安心：共同依賴使失效模式共線。結論既簡單又令人不適：市場正在優化速度，而非韌性。當周期反轉、產能閒置或地緣政治事件一夜重整供應鏈時，帳單會到期。

主權、能源與反堆棧

算力現在是國家權術。歐洲、亞洲與非洲的政府談論 AI 主權，因為它們明白槓桿不在資料集或模型權重，而在誰控制兆瓦與晶片。中國正追求 AI 算力自給，目標在五年內高達 90%，即便部分達成也會重塑全球配置圖。當大國建立分離的堆棧時，市場分裂、避險成本上升。私有市場的預設反應是加倍押注規模，然而沒有多樣性的規模即是脆弱。韌性系統看起來不同：它混合硬體類型、分散供應商、在可行時將負載推到邊緣，並使用對算力節儉的演算法。最後一點在當前敘事中是禁忌。我們慶祝參數數與訓練標記數彷彿那是 GDP，但有時反脆弱的選擇是更小、在裝置上或特定領域化。投資者的視角應從總模型大小轉向每個有用任務的單位經濟與每個正確輸出的能量。能源是速率限制器。比特幣礦工今日運作規模達數十 GW。那種規模是透過透明激勵與無情成本紀律建立的。將此類比套到 AI 很誘人，也有團隊嘗試移植。

去中心化算力的限制

像 Gonka 提議的去中心化網路試圖把閒置 GPU 變成社群網格。這想法借鑑比特幣對哈希的開放市場。其志向高尚，若能大規模運作，可能成為濃縮的一個洩壓閥。但我們應對設計挑戰誠實。Galaxy Research 發現去中心化網路在某些工作負載上可勝出，但驗證與可靠性困難。非營利組織 EPOCH AI 稱之為分散系統的悖論：越開放就越需要協調與驗證。換句話說，你以壟斷風險換取協調風險。那並不自動更好，只是風險輪廓不同。Libermans 說他們避免像委派那類功能以削弱集中化壓力。紙面上那有幫助，但資本密集有其自身吸引力。有錢可賺的地方會出現池、規則被操弄，而有效邊界會圍繞資本雄厚與廉價能源者收斂。單靠技術無法拯救治理。在開放系統中，激勵設計與可稽核性不是附加功能；它們是核心產品。沒有它們，你只會在相同舊有等級體系之上得到一層薄薄的開放外衣。

市場錯估了什麼

市場把 GPU 當成 2007 年的石油來看待：預期價格永遠高漲、且成長只有一條路徑。它低估了兩項風險。首先，來自集中化的安全外部性。你透過少數平台運行越多程式碼與資料，就越容易引來系統性違規。目前那代的 AI 助手已經顯示出多麼容易意外過度曝光內部資訊。第二，對更好演算法的需求彈性。假設只有更多晶片能推動進步對於賣產能者而言是方便的敘事，但計算史顯示軟體效能會周期性重置曲線。編譯器突破、剪枝、蒸餾、檢索與專用模型都能減少大量訓練運行的需求。若此類優化與新供應同時發生，市場從饑荒轉為供過於求的速度會比資本支出回收期快。投資者不應該押注於優化不會發生；應將其納入模型。

通往開放算力的反脆弱之路

如果算力是新的電網，我們應從電網工程學習：你不會依賴單一電廠來提供基載。你混合來源、建立備援，並為局部失效設計。對 AI 而言，這意味三個實務轉變：在單一供應商與單一記憶體技術之外多樣化硬體堆疊；在使用去中心化網路時把驗證推到協議層，讓工作能在不信任工作者的情況下被稽核；並把激勵與可靠性對齊，而不僅僅是貢獻，以便網路獎勵用戶實際需要的東西。這些都不像新模型規模或大量 GPU 訂單那樣成為頭條。它們更慢，也不那麼光鮮。但能存活下來的系統很少光鮮，它們無聊且冗餘。開放算力運動不會靠背誦開放口號而成功；它會靠吸收市場、工程與歷史的教訓成功：集中有效直到不再有效、稀缺導致扭曲行為，而韌性是透過危機前很久就做出的微小決策建立起來的。殘酷的真相仍在：今天擁有晶片的人主導創新的節奏。聰明的資金不只是問如何買更多，而是問如何需要更少、證明更多、並減少對單一失效點的依賴。