台灣法律 AI 粉專「法律偵探」宣布開源「TW Legal RAG」台灣法律語義檢索工具,將約 2,200 萬筆台灣判決裁判結構化並向量化,使用者可用日常口語搜尋判決,並將結果打包成任何 AI(ChatGPT、Claude、Gemini 或本地模型)可直接讀取的格式。工具內建引用驗證功能,可檢查 AI 回覆中的判決字號是否真實存在。
(前情提要:台灣加密專法《虛擬資產服務法》公聽會6大重點:無照業者若涉詐騙加重處理!)
(背景補充:遠東商銀、高檢署簽訂MOU:全台95%加密金流納入反洗、反詐偵查架構)
- 「法律偵探」開源 TW Legal RAG,涵蓋約 2,200 萬筆台灣判決裁判,
pip install twlegalrag即可使用 - 架構為「自帶 AI」模式:工具本身不呼叫 LLM,語義搜尋後打包成 Bundle 供任意 AI 讀取
- 內建引用驗證功能,可檢查 AI 回覆中的判決字號是否真實存在於檢索結果中,防堵幻覺
台灣法律 AI 社群粉專「法律偵探」今日(27)在 Facebook 宣布,歷時半年開發的「TW Legal RAG」(台灣法律 RAG 語義檢索工具)正式開源上線,以 MIT 授權發布。這套工具將約 2,200 萬筆台灣判決裁判結構化並向量化,建構出一個專為法律領域設計的語義檢索系統,任何人都可以透過 pip install twlegalrag 直接安裝使用。
RAG(Retrieval-Augmented Generation,檢索增強生成)是目前解決大型語言模型(LLM)「幻覺」問題的主流技術架構,意思是在模型生成回覆前,先從外部知識庫檢索相關事實,確保輸出有實際資料支撐。這在法律領域尤其關鍵,因為 LLM 編造不存在的判例已多次引發實務爭議,包括美國律師引用 ChatGPT 虛構判例被法院裁罰的知名案例。
開發者自述,他花費了上千小時最佳化檢索管線,成本可能接近百萬元新台幣,現在以 MIT 授權免費開源。
2,200 萬筆判決、自帶 AI 架構、引用驗證
TW Legal RAG 的技術架構與多數法律 AI 工具不同:它本身不呼叫任何 LLM,而是採取「自帶 AI」(BYO-AI)的設計。使用者透過 CLI 工具對後端(Legal Detective 的 TLR 基礎設施,端點為 tlr.dr-lawbot.com)發出語義搜尋請求,系統回傳相關判決後,工具將結果打包成一個結構化的 Bundle,可以直接餵給 ChatGPT、Claude、Gemini 或任何本地模型使用。
這意味著使用者不需要在本地部署嵌入模型或向量索引,整個工具的依賴很輕量,僅需 httpx、typer、rich 三個 Python 套件。
工具提供四個核心指令:
search:用自然語言對 2,200 萬筆判決進行語義檢索pack:將檢索結果打包成 AI 可讀的 Bundle,含判決摘錄與驗證規則check:Bundle 層級的引用驗證,確認 AI 回覆中引述的判決字號是否存在於檢索結果中health:服務狀態檢查
引用驗證功能是這套工具的一大亮點,它透過純正規表示式比對(不依賴 LLM),檢查 AI 生成內容中的判決字號是否真實存在於 Bundle 中。不過開發者也明確標示限制:驗證器無法判斷引述內容是否正確、無法偵測推理錯誤,也無法識別語義改寫式的幻覺,僅能確認字號的存在性。
根據「法律偵探」的貼文,這是一人獨力完成的專案,開發者在半年內投入上千小時最佳化檢索管線,估算成本可能接近百萬元新台幣。
為什麼選擇免費開源?
「法律偵探」在貼文中表示,許多使用者私訊詢問是否收費,他坦言投入了大量資源,但最終仍選擇以 MIT 授權免費開源。部分原因是看到台灣政府目前正在推動各機關主動建置知識 LLM 服務,他希望透過開源為這個方向貢獻力量。
TW Legal RAG 的開源對台灣法律科技生態具有實質意義。目前台灣法律 AI 領域已有多個商業化產品(如 Lawbot AI、法律人 LawPlayer 等),但一套涵蓋 2,200 萬筆判決、可語義檢索、自帶引用驗證的開源工具仍屬稀缺。開發者或新創團隊可以直接取用這套工具整合進自己的應用,而不需要從零建構法律知識庫。
值得注意的是,TW Legal RAG 會將使用者的查詢記錄在伺服器端進行檢索分析,但宣告不用於模型訓練。
目前真實使用體驗,還需司法相關工作人員回饋。
常見問題TW Legal RAG 怎麼使用?
執行 pip install twlegalrag 安裝後,透過 CLI 指令 search 用自然語言搜尋判決,pack 打包成 AI 可讀格式,再餵給 ChatGPT 或 Claude 等任意 LLM 使用。
TW Legal RAG 的引用驗證能防止 AI 幻覺嗎?
引用驗證可確認 AI 回覆中的判決字號是否存在於檢索結果中,但無法判斷引述內容是否正確或偵測語義改寫式的幻覺,僅能做字號層級的存在性驗證。
📍相關報導📍
台灣加密專法《虛擬資產服務法》公聽會6大重點:無照業者若涉詐騙加重處理!
遠東商銀、高檢署簽訂MOU:全台95%加密金流納入反洗、反詐偵查架構
金管會公告首批虛擬資產服務商9家合規,18家列VASP黑名單永久停業







