一個由 BBC 領導的財團表示,AI 助手在大規模地歪曲新聞,45% 的回答在準確性、來源與脈絡上顯示重大問題。這項發現直接落到 Alphabet、Microsoft 以及其他正競相將生成式 AI 放在搜尋、社交與生產力工具首頁的大型科技公司桌上。
由歐洲廣播聯盟(EBU)協調、BBC 領導的一項新國際研究評估了超過 3,000 答案,結論是幾乎一半包含實質性缺陷。Gemini 表現最差,76% 的回應被標示有重大問題,超過同儕兩倍以上。所有模型中,超過三成的答案顯示嚴重來源問題,五分之一包含重大準確性錯誤,14% 缺乏足夠脈絡。這些助手幾乎從不拒絕回答——只有 0.5% 的提示遭到拒絕——突顯出商業上即便資訊不穩時也要自信發言的推力。對市場而言,問題很直接:如果信任是新聞的貨幣,那麼交易有缺陷摘要的平台應該承受多大的折扣率?
研究人員對 ChatGPT、Copilot、Gemini 與 Perplexity 進行多語言的一系列核心與客製化問題測試,然後依準確性、來源、意見與事實的區別以及脈絡進行評分。最常見的失敗是來源——缺失、誤導或錯誤歸屬——其次是赤裸裸的事實錯誤與過時細節。此研究發表之際,另一份 BBC 報告顯示僅略高於三分之一的英國成年人完全信任 AI 能產出準確摘要,而 35 歲以下族群信任度接近五成。這種信任若被誤用,對 AI 開發者與其所摘要的新聞品牌都是負債。正如 BBC 的 Peter Archer 所說,人們必須能信任他們所讀、所看與所見——當他們不能時,既怪罪 AI 供應商,也怪罪出版者。對於將 AI 答案縫合進搜尋、資訊流與助手的上市平台來說,風險不僅是聲譽;也是監管與營收相關的風險。
Alphabet、Microsoft、Amazon 與 Meta 正把生成式答案嵌入搜尋結果、瀏覽器、作業系統與訊息服務。此策略承諾更快的使用時段、更高的參與度與新的廣告格式,同時也集中化責任。如果根據研究定義,幾乎一半與新聞相關的回答存在瑕疵,貨幣化的路徑就變窄,而訴訟與合規成本的路就變寬。對 Alphabet 而言,Gemini 的異常表現加劇了審視,正值 Search Generative Experience 漸次移入主流介面之際。對 Microsoft 而言,Copilot 正成為 Office 內企業知識與新聞消費的前門,準確性主張攸關採購風險。Amazon 正將 AI 編織入購物與 Alexa,Meta 則在 Facebook 與 Instagram 內使用 AI 來摘要與推薦內容。若監管機構決定 AI 中介的新聞傳遞必須符合出版等級的來源與更正標準,這些公司將直接或透過夥伴關係面臨暴露。
信任是可衡量的廣告定價與點擊率驅動因素。若消費者愈來愈多透過可能錯誤歸屬或產生幻覺的 AI 答案接觸新聞,將出現三種結果。第一,品牌可能會猶豫在 AI 生成的實時事件摘要旁投放廣告,特別是在政治或危機新聞週期,對高價位廣告造成壓力。第二,若答案誤導,搜尋與社群可能出現較低的使用者滿意度與更高的跳出率,稀釋生成式版位的價值。第三,出版者——其文章為原料——將升高對授權費與更嚴格執行的要求,推高平台的流量取得與資料成本。矛盾的是:助手很少說不。資料集中只有 0.5% 包含拒絕,意味系統會自信地用某些東西填滿沉默。這種自信在有利時是成長引擎,直到不再有利為止。
這不是真空。EBU 與其成員已經在敦促歐盟與國家監管機構加強對資訊完整性、數位服務與媒體多元性的現行規則執法。於該區域營運的平台須遵守風險評估、透明度報告與系統性風險緩解等義務,違規有嚴重罰則。一份描述失敗為系統性、跨境與多語言的報告,正是監管者用以正當化更強監督的框架。獨立監測很可能成為常態性機制,而非一次性稽核。對投資人而言,這意味著持續性的合規支出、更慢的高頻功能推出,並可能在新聞周圍限制廣告格式。簡言之,歐洲對 AI 整合搜尋與社群的監管貝塔上升,隨著政治審視在 2026 年升溫,對美國也會有溢出效應。
此研究提高了出版者在談判資料、連結與摘要授權時的槓桿。若 AI 摘要因扭曲引用或脈絡而損害品牌信任,出版者會要求更嚴格控管或更高支付——或兩者兼有。預期會更常堅持可驗證的引用、預設的來源連結,以及強制摘錄限額的機器可讀信號。自動更正機制可能成為標配:能在近即時將出版者更新傳遞回 AI 答案的標記。EBU 支持的「AI 助手新聞完整性工具箱」是設定護欄的早期嘗試。對平台而言,成本曲線在上升:更多法律審查、更多安全層與更多結構化資料合約。對投資人而言,除非能以更好的廣告收益或訂閱綁定來抵銷,否則會壓縮 AI 強化新聞版位的利潤率。
在資訊逐小時計變的突發事件中,風險最為清楚。本週發生的羅浮宮高調珠寶竊案——一宗精心策畫、涉及約 100 名調查人員的無保險珍藏被盜——已主導資訊流並催生快速變化的細節。這類故事是 AI 助手急於摘要的範例。在病毒式時刻中,錯誤歸屬或過時的主張可能在市場間引發連鎖反應,從保險與資安供應商到旅遊與文化類股。即便價格未明顯波動,風險也很明顯:錯誤事實廣泛散播、更正滯後且信心侵蝕。BBC-EBU 發現助手在不確定時幾乎不延遲回應,暗示未來會有更多此類壓力測試。當新聞在移動時,一個預設給出答案而非提供引用或拒絕的系統,是偽裝成便利性的責任風險。
接下來的手冊可預見。預期 AI 答案中會出現更明確的引用、更嚴格的新聞來源白名單,以及更清楚標示分析與報導的區別。注意那些允許實時更新與更正傳播的出版者選擇性合作,以及由獨立團體運行、每季公開評分助手的稽核制度。產品團隊會為高速新聞調高拒絕門檻,即便因此犧牲參與度。若這些修正反映在使用與廣告指標上——較低的投訴率、對引用來源更高的點擊率——信任折扣會縮小;若無,監管陰影則會擴大。無論如何,近期的投資問題是 AI 驅動的答案框是否能比其提高的成本與審視更快提升營收,對 GOOGL、MSFT、AMZN 與 META 而言。
對於較年輕的使用者,AI 助手正成為獲取新聞的主要入口,而這一族群是業界需要留住的。然而最新數據顯示這些系統在基礎新聞室紀律上失誤:驗證、歸屬、情境化。投資人不需要完美,但需要一條從今日錯誤率到可接受常態的可信路徑。未來數季將測試平台是否能在監管機構與出版者代為苦整之前自行設計出這條路。在一個以信任換取時間與金錢的市場,弄錯新聞是一項可衡量、可貨幣化的風險。