大英百科控告 OpenAI 侵權，指其抓取文章訓練模型，構成市場替代。訴訟爭點為訓練資料的「合理使用」界線與 AI 幻覺造成的品牌損害。本案判決將影響生成式 AI 的資料授權模式與數位出版權益。大英百科控告 OpenAI 侵權，指其抓取文章訓練模型，構成市場替代。訴訟爭點為訓練資料的「合理使用」界線與 AI 幻覺造成的品牌損害。本案判決將影響生成式 AI 的資料授權模式與數位出版權益。

OpenAI 遭《大英百科》控告侵權：聚焦 RAG 技術爭議與《蘭哈姆法案》商標法衝突

作者：Inside

來源：Inside

2026/03/17 09:54

閱讀時長 6 分鐘

如需對本內容提供反饋或相關疑問，請通過郵箱 crypto.news@mexc.com 聯絡我們。

根據外媒報導，《大英百科全書》（Encyclopedia Britannica）與其旗下的《梅里亞姆-韋伯斯特》（Merriam-Webster）已正式入稟法院，控告人工智慧公司 OpenAI 涉嫌大規模侵犯著作權。原告指稱，OpenAI 未經許可抓取其線上平台近 10 萬篇受版權保護的文章，用於訓練大型語言模型（LLM）。訴狀同時指出，ChatGPT 的輸出內容與原文高度雷同，且其產生的錯誤資訊（AI 幻覺）錯誤歸因於出版商，已違反美國商標法《蘭哈姆法案》（Lanham Act）。

本案的法律核心在於數位出版物在 AI 時代的權利歸屬與商業競爭。根據《大英百科》向法院提交的陳述，OpenAI 的行為被界定為未經授權的商業利用。原告主張，該公司長期投入資源產製的高品質編輯內容，被 OpenAI 作為訓練數據，進而產出與原著內容形成「直接競爭」的數位產品。

訴狀中特別針對 OpenAI 的「檢索增強生成」（RAG）技術提出質疑。在現行的 ChatGPT 運作流程中，模型會掃描網路資料庫以回應使用者的最新查詢。原告認為，這種運作模式產生的回覆，往往能完全取代使用者點閱原始網頁的需求，導致出版商流失原本的數位廣告收益與訂閱潛力。從法律角度來看，這涉及了著作權法中的「合理使用」（Fair Use）與「市場替代效應」的爭議。

除了著作權問題，本案也觸及了 AI 幻覺對權威品牌的潛在損害。根據《蘭哈姆法案》，原告指控 OpenAI 在生成虛假事實時，仍將其來源歸類為《大英百科》，這種誤導性的歸因可能削弱大眾對權威資訊來源的信任。原告在訴狀中強調，這不僅是單一企業的財務損失，更關乎大眾在數位環境中持續獲取高品質、經過查核資訊的權利與管道。

目前，美國司法界對於 AI 模型訓練是否構成侵權仍無定論。在此之前的 Anthropic 案件中，聯邦法官 William Alsup 曾裁定將版權內容作為訓練數據具有「轉化性」（Transformative），傾向於認定其不必然構成侵權。然而，該法官亦指出，若取得數據的手段涉及非法下載（而非支付合法的授權費用），則仍需承擔法律責任，該案最終達成 15 億美元的和解。這份先例為本案提供了關鍵的法律參考：OpenAI 獲取這 10 萬篇文章的途徑與合約狀態，將成為後續法庭辯論的重點。

《大英百科》的法律行動，是全球出版業對抗生成式 AI 浪潮的最新篇章。目前，包含《紐約時報》、Ziff Davis 集團（旗下擁有 Mashable 與 PC Mag 等媒體），以及分布於美國與加拿大的十餘家報社（如《芝加哥論壇報》、加拿大廣播公司 CBC）均已對 OpenAI 提起類似訴訟。此外，《大英百科》針對另一家 AI 搜尋服務提供商 Perplexity 的法律程序也正在進行中。

截至目前，OpenAI 尚未針對此起訴訟發表正式評論。

法律專家分析，本案的判決結果將直接影響未來 AI 模型獲取數據的合規門檻。若法院認定 OpenAI 的抓取行為超出了合理使用範疇，這將迫使科技巨頭與內容出版商建立長期的授權機制，重塑生成式 AI 的商業獲利模型。

責任編輯：Claire

本文初稿由 INSIDE 使用 AI 協助編撰，並經人工審校確認；加入 INSIDE 會員，獨享 INSIDE 科技趨勢電子報，點擊立刻成為會員！