根據外媒報導,《大英百科全書》(Encyclopedia Britannica)與其旗下的《梅里亞姆-韋伯斯特》(Merriam-Webster)已正式入稟法院,控告人工智慧公司 OpenAI 涉嫌大規模侵犯著作權。原告指稱,OpenAI 未經許可抓取其線上平台近 10 萬篇受版權保護的文章,用於訓練大型語言模型(LLM)。訴狀同時指出,ChatGPT 的輸出內容與原文高度雷同,且其產生的錯誤資訊(AI 幻覺)錯誤歸因於出版商,已違反美國商標法《蘭哈姆法案》(Lanham Act)。
本案的法律核心在於數位出版物在 AI 時代的權利歸屬與商業競爭。根據《大英百科》向法院提交的陳述,OpenAI 的行為被界定為未經授權的商業利用。原告主張,該公司長期投入資源產製的高品質編輯內容,被 OpenAI 作為訓練數據,進而產出與原著內容形成「直接競爭」的數位產品。
訴狀中特別針對 OpenAI 的「檢索增強生成」(RAG)技術提出質疑。在現行的 ChatGPT 運作流程中,模型會掃描網路資料庫以回應使用者的最新查詢。原告認為,這種運作模式產生的回覆,往往能完全取代使用者點閱原始網頁的需求,導致出版商流失原本的數位廣告收益與訂閱潛力。從法律角度來看,這涉及了著作權法中的「合理使用」(Fair Use)與「市場替代效應」的爭議。
除了著作權問題,本案也觸及了 AI 幻覺對權威品牌的潛在損害。根據《蘭哈姆法案》,原告指控 OpenAI 在生成虛假事實時,仍將其來源歸類為《大英百科》,這種誤導性的歸因可能削弱大眾對權威資訊來源的信任。原告在訴狀中強調,這不僅是單一企業的財務損失,更關乎大眾在數位環境中持續獲取高品質、經過查核資訊的權利與管道。
目前,美國司法界對於 AI 模型訓練是否構成侵權仍無定論。在此之前的 Anthropic 案件中,聯邦法官 William Alsup 曾裁定將版權內容作為訓練數據具有「轉化性」(Transformative),傾向於認定其不必然構成侵權。然而,該法官亦指出,若取得數據的手段涉及非法下載(而非支付合法的授權費用),則仍需承擔法律責任,該案最終達成 15 億美元的和解。這份先例為本案提供了關鍵的法律參考:OpenAI 獲取這 10 萬篇文章的途徑與合約狀態,將成為後續法庭辯論的重點。
《大英百科》的法律行動,是全球出版業對抗生成式 AI 浪潮的最新篇章。目前,包含《紐約時報》、Ziff Davis 集團(旗下擁有 Mashable 與 PC Mag 等媒體),以及分布於美國與加拿大的十餘家報社(如《芝加哥論壇報》、加拿大廣播公司 CBC)均已對 OpenAI 提起類似訴訟。此外,《大英百科》針對另一家 AI 搜尋服務提供商 Perplexity 的法律程序也正在進行中。
截至目前,OpenAI 尚未針對此起訴訟發表正式評論。
法律專家分析,本案的判決結果將直接影響未來 AI 模型獲取數據的合規門檻。若法院認定 OpenAI 的抓取行為超出了合理使用範疇,這將迫使科技巨頭與內容出版商建立長期的授權機制,重塑生成式 AI 的商業獲利模型。
責任編輯:Claire
本文初稿由 INSIDE 使用 AI 協助編撰,並經人工審校確認;加入 INSIDE 會員,獨享 INSIDE 科技趨勢電子報,點擊立刻成為會員!
延伸閱讀:


