2020 年,Timnit Gebru 因拒絕撤下一篇警告 AI 系統風險的論文而被 Google 開除。五年 […] 〈她寫了 14 頁論文被 Google 開除,五年後所有 AI 風險預言全部命中〉這篇文章最早發佈於動區BlockTempo《動區動趨-最具影響力的區塊鏈新聞媒體》。2020 年,Timnit Gebru 因拒絕撤下一篇警告 AI 系統風險的論文而被 Google 開除。五年 […] 〈她寫了 14 頁論文被 Google 開除,五年後所有 AI 風險預言全部命中〉這篇文章最早發佈於動區BlockTempo《動區動趨-最具影響力的區塊鏈新聞媒體》。

她寫了 14 頁論文被 Google 開除,五年後所有 AI 風險預言全部命中

2026/06/05 12:04
閱讀時長 10 分鐘
如需對本內容提供反饋或相關疑問,請通過郵箱 crypto.news@mexc.com 聯絡我們。

2020 年,Timnit Gebru 因拒絕撤下一篇警告 AI 系統風險的論文而被 Google 開除。五年後,那篇 14 頁文章裡的五個核心預言,幻覺、偏見、碳排、資料汙染、語言中心化,全數命中。
(前情提要:AI 與 ChatGPT 機器人為何越來越差?Nature 研究:模型越大沒幫助
(背景補充:史丹佛報告:AI 耗電達比特幣挖礦一半,中美模型差距僅剩 2.7%

本文目錄

Toggle
  • 14 頁,五類系統性風險
  • 五個預言,五組現實對照
  • 最深的預言,從第一天就成真了

篇 14 頁的學術論文,讓她失去了工作…。2020 年 12 月,Timnit Gebru 還在休假,卻收到一封 email,告知她已被 Google 解雇。當時她的身份是 Google 倫理 AI 團隊共同負責人。

她被開除的原因,是 Google 要求她撤下或拿掉員工掛名的一篇論文。那篇論文在她離職後三個月,於 2021 年 3 月正式刊登於 ACM FAccT 研討會。標題是〈論隨機鸚鵡的危險:語言模型會不會太大?〉,六位共同作者中有四位是 Google 員工,另一位以化名「Shmargaret Shmitchell」掛名,本名 Margaret Mitchell,後來同樣遭到 Google 解雇。

五年後回頭看,這篇文章的每一個核心警告,都在現實中找到了對應的案例。

14 頁,五類系統性風險

〈隨機鸚鵡〉論文的核心主張,是大型語言模型(LLM)在結構上存在五類系統性風險:幻覺與無理解、偏見放大、環境成本、訓練資料無法稽核、以及語言中心化導致低資源語言劣化。但論文真正最深的一條論點,是這五條之所以難以被解決的根本原因。

論文明確指出:打造 LLM 的公司,其財務與競爭誘因在結構上不可能讓「安全與倫理」拖慢產品上線速度。簡單來說就是,只要市場競爭夠激烈、資本壓力夠大,任何公司都會在「快點上線」和「做得夠安全」之間傾向前者。

Gebru 被開除這件事本身,就是最直接的注腳。她提出的是一份帶引用的研究檔案;Google 的回應,是要求她拿掉員工掛名或撤稿。她拒絕,然後在休假中收到開除通知。

五個預言,五組現實對照

預言一:流暢但無理解

論文在 2021 年就描述了後來被稱為「幻覺」的現象:LLM 只是依照機率把語言形式縫在一起,「沒有任何對意義的指涉」。聽起來通順,不代表說的是真的,這就是今天每個 AI 用戶都遇過的問題。

預言二:偏見放大

論文警告,用歷史資料訓練的模型會系統性地複製既有偏見。Amazon 從 2014 年開發的 AI 招募工具,到 2018 年因系統性歧視女性應徵者被廢棄,模型從以男性為主的歷史履歷中學到「優秀工程師」的樣子,導致含「women’s」字樣的履歷自動扣分。

Obermeyer 等人 2019 年發表於《Science》的研究則揭露,一個廣泛使用的醫療風險演算法以「醫療花費」替代「病情嚴重程度」,導致相同風險分數下黑人病患實際病情更重;修正後,被標記需要額外照護的黑人病患比例將從 17.7% 提高到 46.5%。

預言三:環境成本

論文引用 Strubell 等人 2019 年的研究,警告訓練成本被低估。這個論點後來被流傳為「訓練一個模型等於 5 輛車終身排放」,但需要釐清:那是使用神經架構搜尋(NAS)這個極端情境下的數字,約 284 公噸 CO₂e,並非每個模型的普遍情況。

真實的後續發展更令人不安。Google 2024 年環境報告顯示,2023 年溫室氣體排放達約 1,430 萬公噸 CO₂e,較 2019 年基準增加 48%,主因是 AI 帶動的資料中心用電大幅攀升,直接威脅 Google 原訂的 2030 年碳中和目標。

預言四:訓練資料無法稽核

論文警告,網路規模資料集太大,有害內容會混入而不被發現。2023 年 12 月,史丹佛網路觀測站在 LAION-5B 資料集中找到 3,226 筆疑似兒少性虐待內容(CSAM),其中 1,008 筆經外部機構確認。LAION-5B 是包含 58.5 億組圖文對的公開爬取資料集,曾用來訓練 Stable Diffusion,事件曝光後隨即下架。規模越大,盲點越大。

預言五:語言中心化

論文指出英語為主的語料庫會造成語言能力落差。這個預言後來衍生出一個被扭曲的說法:「57% 的新英文網頁是 AI 生成」,這是錯的。Thompson 等人 2024 年的研究分析了 63.8 億個句子組成的網路語料庫,發現其中 57.1% 的句子屬於多語平行集合,也就是很可能是機器翻譯產生的低品質重複內容,且在低資源語言中比例尤高。

低資源語言的處境不只是被忽視,而是正在被劣質機器翻譯的產物汙染,這正是 Gebru 原始預言的核心。

最深的預言,從第一天就成真了

五個預言,每一個都在現實中找到了對應案例,時間從 2018 年到 2024 年不等。但論文最核心的主張,從來不是「AI 會出問題」這種模糊警告,而是「整個系統被設計成無法自我修正」。

誘因決定行為。當競爭壓力要求快速上線,當公開提出安全疑慮可能讓整個團隊工作被停下來,理性的選擇就會是沉默。Gebru 的案例在 AI 研究社群留下一個清晰訊號:公開提出安全質疑,可能毀掉職涯。這個寒蟬效應,本身就是論文警告的機制在運作。

重點不是她每個細節都猜中了。重點是,她描述的那個系統,競爭誘因壓過倫理審查、規模壓過可稽核性、速度壓過安全,五年來沒有根本性地改變。而這個最深的預言,從她收到那封開除 email 的那一刻起,就已經完成驗證了。

📍相關報導📍

AI 徵才會認「自己的筆跡」,研究發現:同款 AI 寫的履歷,入取率直接暴增 60%

OpenAI 解釋為何會有 AI 幻覺?改變評估迷思的三種解法

資料投毒正在蔓延》安永會計師事務所 44 頁資安報告被踢爆:27 條引用中 16 條是 AI 捏造

市場機遇
Gensyn 圖標
Gensyn實時價格 (AI)
$0,02599
$0,02599$0,02599
-4,30%
USD
Gensyn (AI) 實時價格圖表

SPACEX(PRE) Launchpad

SPACEX(PRE) LaunchpadSPACEX(PRE) Launchpad

註冊即有機會獲得免費抽獎資格

免責聲明: 本網站轉載的文章均來源於公開平台,僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利,請聯絡 crypto.news@mexc.com 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證,並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考,不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。

真實美股已上線

真實美股已上線真實美股已上線

透過持牌券商,用 USDT 交易真實美股