她寫了 14 頁論文被 Google 開除，五年後所有 AI 風險預言全部命中

2020 年，Timnit Gebru 因拒絕撤下一篇警告 AI 系統風險的論文而被 Google 開除。五年後，那篇 14 頁文章裡的五個核心預言，幻覺、偏見、碳排、資料汙染、語言中心化，全數命中。
（前情提要：AI 與 ChatGPT 機器人為何越來越差？Nature 研究：模型越大沒幫助）
（背景補充：史丹佛報告：AI 耗電達比特幣挖礦一半，中美模型差距僅剩 2.7%）

本文目錄

Toggle

14 頁，五類系統性風險
五個預言，五組現實對照
最深的預言，從第一天就成真了

一篇 14 頁的學術論文，讓她失去了工作…。2020 年 12 月，Timnit Gebru 還在休假，卻收到一封 email，告知她已被 Google 解雇。當時她的身份是 Google 倫理 AI 團隊共同負責人。

她被開除的原因，是 Google 要求她撤下或拿掉員工掛名的一篇論文。那篇論文在她離職後三個月，於 2021 年 3 月正式刊登於 ACM FAccT 研討會。標題是〈論隨機鸚鵡的危險：語言模型會不會太大？〉，六位共同作者中有四位是 Google 員工，另一位以化名「Shmargaret Shmitchell」掛名，本名 Margaret Mitchell，後來同樣遭到 Google 解雇。

五年後回頭看，這篇文章的每一個核心警告，都在現實中找到了對應的案例。

14 頁，五類系統性風險

〈隨機鸚鵡〉論文的核心主張，是大型語言模型（LLM）在結構上存在五類系統性風險：幻覺與無理解、偏見放大、環境成本、訓練資料無法稽核、以及語言中心化導致低資源語言劣化。但論文真正最深的一條論點，是這五條之所以難以被解決的根本原因。

論文明確指出：打造 LLM 的公司，其財務與競爭誘因在結構上不可能讓「安全與倫理」拖慢產品上線速度。簡單來說就是，只要市場競爭夠激烈、資本壓力夠大，任何公司都會在「快點上線」和「做得夠安全」之間傾向前者。

Gebru 被開除這件事本身，就是最直接的注腳。她提出的是一份帶引用的研究檔案；Google 的回應，是要求她拿掉員工掛名或撤稿。她拒絕，然後在休假中收到開除通知。

五個預言，五組現實對照

預言一：流暢但無理解

論文在 2021 年就描述了後來被稱為「幻覺」的現象：LLM 只是依照機率把語言形式縫在一起，「沒有任何對意義的指涉」。聽起來通順，不代表說的是真的，這就是今天每個 AI 用戶都遇過的問題。

預言二：偏見放大

論文警告，用歷史資料訓練的模型會系統性地複製既有偏見。Amazon 從 2014 年開發的 AI 招募工具，到 2018 年因系統性歧視女性應徵者被廢棄，模型從以男性為主的歷史履歷中學到「優秀工程師」的樣子，導致含「women’s」字樣的履歷自動扣分。

Obermeyer 等人 2019 年發表於《Science》的研究則揭露，一個廣泛使用的醫療風險演算法以「醫療花費」替代「病情嚴重程度」，導致相同風險分數下黑人病患實際病情更重；修正後，被標記需要額外照護的黑人病患比例將從 17.7% 提高到 46.5%。

預言三：環境成本

論文引用 Strubell 等人 2019 年的研究，警告訓練成本被低估。這個論點後來被流傳為「訓練一個模型等於 5 輛車終身排放」，但需要釐清：那是使用神經架構搜尋（NAS）這個極端情境下的數字，約 284 公噸 CO₂e，並非每個模型的普遍情況。

真實的後續發展更令人不安。Google 2024 年環境報告顯示，2023 年溫室氣體排放達約 1,430 萬公噸 CO₂e，較 2019 年基準增加 48%，主因是 AI 帶動的資料中心用電大幅攀升，直接威脅 Google 原訂的 2030 年碳中和目標。

預言四：訓練資料無法稽核

論文警告，網路規模資料集太大，有害內容會混入而不被發現。2023 年 12 月，史丹佛網路觀測站在 LAION-5B 資料集中找到 3,226 筆疑似兒少性虐待內容（CSAM），其中 1,008 筆經外部機構確認。LAION-5B 是包含 58.5 億組圖文對的公開爬取資料集，曾用來訓練 Stable Diffusion，事件曝光後隨即下架。規模越大，盲點越大。

預言五：語言中心化

論文指出英語為主的語料庫會造成語言能力落差。這個預言後來衍生出一個被扭曲的說法：「57% 的新英文網頁是 AI 生成」，這是錯的。Thompson 等人 2024 年的研究分析了 63.8 億個句子組成的網路語料庫，發現其中 57.1% 的句子屬於多語平行集合，也就是很可能是機器翻譯產生的低品質重複內容，且在低資源語言中比例尤高。

低資源語言的處境不只是被忽視，而是正在被劣質機器翻譯的產物汙染，這正是 Gebru 原始預言的核心。