九成 AI 專案失敗背後：提示詞債、檢索債、評估債正在拖垮企業部署

2025 年有 42% 企業砍掉多個 AI 計畫，遠超前一年的 17%。問題不在模型不夠強，而在一種新型技術債正在企業 AI 基礎設施中靜默累積，提示詞債、檢索債、評估債。
（前情提要：Harness Engineering 是什麼？拆解 AI Agent 真正落地的 7 大工程模組(AI 駕馭工程)）
（背景補充：GPT-5.5 Instant 向全體用戶開放，OpenAI 教你怎麼寫 Prompt 更聰明、有效率）

本文目錄

Toggle

三種新型債務，比 Bug 更難抓
看不見的監控缺口
解法不在模型，在系統設計

42%，這是 2025 年叫停多個 AI 計畫的企業佔比，比前一年整整翻了一倍半。S&P Global Market Intelligence 的資料表明，AI 失敗不是偶發現象，而是系統性問題。MIT 同年研究則指出，95% 的 AI 試點從未真正進入生產環境或創造出可量化的商業價值。

這些失敗通常被歸咎於模型能力不足、資料品質差，或 ROI 難以說明。但 Cota Capital 主管 Vikram 認為，真正的肇因更隱蔽：一種新形態的技術債正在 AI 系統的提示詞層、模型依賴層與評估層中悄悄累積，與傳統程式碼債完全不同，卻同樣致命。

三種新型債務，比 Bug 更難抓

傳統技術債存在於程式碼庫中，Bug 可以重現、可以測試、可以修復。AI 債務的特性截然不同：它是分散式的，分布在提示詞、模型 API、資料管道與基礎設施的各個層次。

它是間歇性的，因為 AI 系統本質上具有機率性，同樣的輸入不保證得到同樣的輸出；它也幾乎不可見，因為系統「看起來」在正常運作，直到某個關鍵時刻整體崩潰。

提示詞債（Prompt Debt）是三者中最顯而易見的一種。它沒有檔案記錄的臨時調整、沒有版本控制的提示詞異動，以及「提示詞填塞」把大量不相干的背景資訊硬塞進提示詞，試圖讓模型理解更多。

結果過來就是，提示詞變成了一種沒有型別、沒有測試、沒有版本管理的非正式程式碼。每次微調都是在一個不透明的系統上進行，累積下去，系統的脆弱性也隨之指數增長。

模型依賴債（Model Dependency Debt）則源自企業對外部基礎模型 API 的高度依賴。應用程式的邏輯建立在呼叫外部模型的基礎上，但這些模型的更新不在企業掌控之中。

當模型供應商靜默升級版本，針對舊版本精心調校的提示詞可能直接失效，或輸出行為出現難以預測的漂移。可重現性從此消失。

檢索債（Retrieval Debt）出現在大多數企業 AI 部署採用的 RAG 架構中。問題在於，那些資料倉庫裡往往堆滿了混亂的資料、重複的檔案，以及早已過期的資訊。AI 因此回傳的答案，技術上曾經是正確的，只是現在已經不再適用。這比幻覺更難被察覺，因為它看起來完全合理，甚至能透過一般測試人員的審閱。