DARPA的AI網路挑戰賽在DEF CON收官 Theori獲150萬美元,CrowdStrike、Palo Alto與微軟成焦點

發佈于: 8 月 11, 2025
編輯: Maya Trent

市場背景與催化劑:在拉斯維加斯,國防高等研究計畫局 DARPA 於 DEF CON 33 結束為期兩年的 AI Cyber Challenge,總獎金達850萬美元,為軟體供應鏈風險與 AI 部署在標普500 公司中相互碰撞的時刻,提出了一項新的 AI 安全基準。美韓聯合的進攻性資安團隊 Theori 奪得第三名與150萬美元,Team Atlanta 贏得400萬美元,Trail of Bits 獲300萬美元。這場活動並非走過場。DARPA 表示,決賽隊伍的自動化系統在植入漏洞中找出77%、完成61%的修補,並在真實程式碼中發現了18個此前未知的缺陷。DARPA 主任 Stephen Winchell 評價,該計畫展現了嚴謹、創新且高風險高回報的工作方式。對公開市場投資人而言,結論明確:自動化的漏洞發現與修補已從研究走向可操作的現實,這將影響你對微軟,MSFT、Alphabet 旗下 Mandiant,GOOGL、CrowdStrike,CRWD、Palo Alto Networks,PANW、Fortinet,FTNT、Zscaler,ZS 與 SentinelOne,S 的成長與利潤預估。

AIxCC 真正證明的事:參賽的 Cyber Reasoning Systems 不只是掃描程式碼;它們能協調端到端流程,無需人為介入便能分級、利用並修補漏洞。在一場充滿敵意、時間受限的競賽中達到77%的發現率與61%的修補率,對於依賴人工紅隊、分散掃描器與人員介入的既有做法而言,是一個令人不安的數據。競賽中發現的18個真正的零日或一日漏洞,顯示這不是花招而是真正信號。若你負責財富500強的技術風險,短期內的影響不是全面取代你核心的 EDR 或下一代防火牆產品,而是縮短從揭露到修復的時間窗,並推動 CI/CD 中以機器速度運行的變更管理。平均修復時間是董事會追蹤的關鍵績效指標,AIxCC 顯示該指標即將被壓縮。

開源釋出是倍增器:DARPA 計畫將決賽系統開源,把強大的自動化原語交到任何運作 DevSecOps 管線者手中。上一次政府催化資安工具的階段性躍升並廣泛開放時,商業廠商便為其構建了完善的包裝、協調層與企業級控管。這次也會如此。微軟,MSFT 可以把 CRS 邏輯接入 GitHub Advanced Security 與 Defender for Cloud。GitLab,GTLB 能在合併請求中直接呈現檢測結果。雲端供應商 AMZN 與 GOOGL 可以把它做成與程式碼掃描並列的託管服務。開放模型縮短產品團隊的上市時間,壓低靜態與動態分析的定價,並使平台廣度與整合能力成為優勢。這通常偏向擁有分銷與遙測規模的既有大廠,而非單一工具。

勝者名單揭示的趨勢:Team Atlanta 的勝利與 Trail of Bits 的次席表明一個趨勢:小而深度專精的團隊,比大型廠商更能迅速推出前沿等級的利用與修補邏輯。Theori 的第三名,團隊跨越美國與南韓,凸顯國際合作已成為尖端資安研發的基本條件。對投資人來說,這樣的組合意味著併購機會。誰能先把這些 CRS 打造成企業級產品體驗,誰就可能被收購或結成戰略夥伴。留意私募資金輪與旨在為受管制垂直市場與政府包裝此能力的策略交易。預期會有針對電力、電信等需要可證明、可稽核自動化的大型用戶的早期試點。

對 CrowdStrike、Palo Alto Networks、Fortinet、SentinelOne、Zscaler 的影響:端點、身分與網路領域的龍頭不會直接被取代。CRS 堆疊位於上游與相鄰層,更貼近原始碼、建置與相依性管理。但它確實威脅到傳統應用安全測試與人工程式碼審查的預算份額。有市場與自動化骨幹的平臺型業者可以把這視為功能而非威脅。CrowdStrike 的 Falcon Foundry 與 Palo Alto Networks 的 Prisma Cloud 可內嵌自動化修補建議與經驗證的熱修補。Zscaler 可以用機器生成的利用情報豐富內聯策略。Fortinet 與 SentinelOne 可用 CRS 驅動的修補,豐富回應劇本以應對客製化應用。戰略風險在於惰性:若這些公司在產品化 CRS 能力上落後,開發者優先的平台將在程式碼與雲端交界處吸走安全心智份額。預期財報電話會議中,相關公司會開始把話術轉向「自主修復」與「AI 加強的 SDLC」作為新產品敘事。

採購路徑與誰能掌握:在政府與關鍵基礎設施領域,系統整合商短期內最有利。Booz Allen,BAH、Leidos,LDOS、CACI,CACI、SAIC,SAIC 與 Palantir,PLTR 能把開源 CRS 包裝成符合授權運行準則的方案,並加入日誌、基於角色的控管與合規性連接。聯邦採購周期偏好能降低實施摩擦的供應商,開源核心移除了授權障礙,同時為服務利潤留出空間。對受管制產業而言,第三方風險與變更控管限制會放慢直接採用步伐。這使得由大型雲端與 MDR 供應商提供的託管 CRS 服務成為可行的切入產品。務實的路徑是共同銷售:雲端額度加上與工單及 SIEM 連結的託管 CRS 層。

供應鏈與運算面的影響:CRS 工作負載並非類變壓器尺度的大型語言模型。它們是以協調為主、結合模糊測試與推理驅動的管線,可能在以 CPU 為主的環境中更有效率,並針對特定任務採用 GPU 加速。總體而言,這不是一個新的 H100 超級循環。但隨著企業在單一原始碼庫與容器艦隊中部署 CRS,對可擴展運算與儲存的穩定需求會提升。這利於超大廠的安全工作負載與市集收入,並為 Nvidia,NVDA 提供機會,推廣其以 CUDA 加速的安全函式庫與 Morpheus 框架作為 AI 驅動偵測與修復的執行時。若 CRS 管線更依賴 CI/CD 農場中的 CPU 密度,AMD 與 Intel 也將受惠。更大的商業動能在於減少跨雲資料外流:把程式碼與 artifact 分析維持在應用運行的同一雲域內。

對漏洞經濟的壓力:若自主系統能比人工狩獵者更快地挖掘並修補高風險缺陷,漏洞賞金動態將改變。低到中等嚴重度發現的定價可能走低。CVE 從公開到修補的間隔可能縮短,同時利用者也可能使用類似自動化工具與防守方競速。能推送驗證修補而不破壞生產環境的組織將獲得更多槓桿。預期會出現對自動生成可利用性證明、機器可讀的軟體物料清單更新與可被稽核接受的見證日誌的新需求。能把 CRS 輸出與 Jira、ServiceNow 的工單關閉連結,並提供可驗證運行時驗證的廠商,將贏得企業信任。

投資人接下來應觀察的事項:有三個指標可以判定這是否真能成為營收驅動。第一,整合速度:觀察微軟,MSFT、GOOGL、AMZN 與 GitLab,GTLB 是否宣布 CRS 能力已內嵌於 CI/CD,非作為側車服務。第二,關鍵績效變動:平台型安全公司在季度電話會議中是否報告平均修復時間與漏洞積壓的下降。第三,政策訊號:若 CISA 與各部門風險管理機構在未來指引中採納基於 CRS 的作法,採用就會跟上。另要注意專有資料集是否成為護城河。能在保護隱私的前提下,針對客戶特定程式碼庫微調 CRS 模組的廠商將有所差異化。與此同時,DEF CON 的得獎者已經立下標竿。獎金雖小,戰略大獎是掌握程式碼與安全最終以機器速度協同運作的那條管線。

人工智能