作者拆解一次 OpenClaw 工作負載後發現,79% 的 token 消耗來自快取字首重播(cached p […] 〈OpenClaw 省錢攻略:一天燒掉 2150 萬 tokens,我做對了什麼?〉這篇文章最早發佈於動區BlockTempo《動區動趨-最具影響力的區塊鏈新聞媒體》。作者拆解一次 OpenClaw 工作負載後發現,79% 的 token 消耗來自快取字首重播(cached p […] 〈OpenClaw 省錢攻略:一天燒掉 2150 萬 tokens,我做對了什麼?〉這篇文章最早發佈於動區BlockTempo《動區動趨-最具影響力的區塊鏈新聞媒體》。

OpenClaw 省錢攻略:一天燒掉 2150 萬 tokens,我做對了什麼?

2026/03/10 19:12
閱讀時長 6 分鐘
如需對本內容提供反饋或相關疑問,請通過郵箱 crypto.news@mexc.com 聯絡我們。
作者拆解一次 OpenClaw 工作負載後發現,79% 的 token 消耗來自快取字首重播(cached prefix replay),而非使用者輸入或模型輸出,並提出三大上下文最佳化策略,有效壓低 AI Agent 營運成本。本文源自 MOSHIII 所著文章《Why My OpenClaw Sessions Burned 21.5M Tokens in a Day (And What Actually Fixed It)》,由動區編輯、翻譯。 (前情提要:MEXC 躋身全球 Top 3 CEX,深化現貨與大宗商品市場布局) (背景補充:熊市靠穩定幣生息:各平台利息比較 OSL 18%、MEXC 15%、Binance 8%……)   我分析了一次真實的 OpenClaw 工作負載,發現了一個我認為很多 Agent 使用者都會認出來的模式: token 使用量看起來很「活躍」 回覆看起來也很正常 但 token 消耗卻突然爆炸式增長 下面是這次分析的 結構拆解、根本原因,以及實際可行的修復路徑。 最大成本驅動:快取前綴重播 最大的成本驅動因素 並不是使用者訊息太長。而是巨量的快取字首(cached prefix)被反覆重放。 從 session 資料來看: 總 tokens:21,543,714 cacheRead:17,105,970(79.40%) input:4,345,264(20.17%) output:92,480(0.43%) 換句話說:大多數呼叫的成本,其實並不是在處理新的使用者意圖,而是在反覆讀取巨大的歷史上下文。 我原本以為高 token 使用量來自:非常長的使用者 prompt、大量輸出生成、或者昂貴的工具呼叫。 但真正主導的模式是: input:幾百到幾千 token cacheRead:每次呼叫 17 萬到 18 萬 token 也就是說,模型 每一輪都在反覆讀取同一個巨大的穩定字首。 Session 數據拆解 我分析了兩個層面的資料: 1、執行時日誌(runtime logs) 2、會話記錄(session transcripts) 需要說明的是: 執行日誌主要用於觀察行為訊號(如重啟、報錯、配置問題) 精確的 token 統計來自 session JSONL 中的 usage 欄位 使用的指令碼: scripts/session_token_breakdown.py scripts/session_duplicate_waste_analysis.py 生成的分析檔案: tmp/session_token_stats_v2.txt tmp/session_token_stats_v2.json tmp/session_duplicate_waste.txt tmp/session_duplicate_waste.json tmp/session_duplicate_waste.png 有一個 session 的消耗遠高於其他: 570587c3-dc42-47e4-9dd4-985c2a50af86:19,204,645 tokens 然後是明顯斷崖式下降: ef42abbb-d8a1-48d8-9924-2f869dea6d4a:1,505,038 ea880b13-f97f-4d45-ba8c-a236cf6f2bb5:649,584 token 主要來自: toolUse:16,372,294 stop:5,171,420 說明問題主要出在 工具呼叫鏈迴圈,而不是普通聊天。 Token 峰值從何而來? token 峰值並不是隨機的,而是集中在幾個小時段: 2026-03-08 16:00:4,105,105 2026-03-08 09:00:4,036,070 2026-03-08 07:00:2,793,648 並不是對話內容,而主要是 大型中間產物: 巨大的 toolResult 資料塊 很長的 reasoning / thinking traces 大型 JSON 快照 檔案列表 瀏覽器抓取資料 子 Agent 的對話記錄 在最大 session 中,字元量大約是: toolResult:text:366,469 字元 assistant:thinking:331,494 字元 assistant:toolCall:53,039 字元 一旦這些內容被保留在歷史上下文中,後續每次呼叫都可能 透過 cache 字首重新讀取它們。 在以下位置反覆出現了 體量巨大的上下文塊: sessions/570587c3-dc42-47e4-9dd4-985c2a50af86.jsonl:70 大型閘道器 JSON 日誌(約 3.7 萬字元) sessions/570587c3-dc42-47e4-9dd4-985c2a50af86.jsonl:134 瀏覽器快照 + 安全封裝(約 2.9 萬字元) sessions/570587c3-dc42-47e4-9dd4-985c2a50af86.jsonl:219 巨大的檔案列表輸出(約 4.1 萬字元) sessions/570587c3-dc42-47e4-9dd4-985c2a50af86.jsonl:311 session/status 狀態快照 + 大型 prompt 結構(約 3 萬字元) 我也測量了 單次呼叫內部的重複內容比例: 重複比例約:1.72% 確實存在,但並不是主要問題。 真正的問題是:快取字首的絕對體量太大 結構是:巨大的歷史上下文、每輪呼叫重新讀取、上面只疊加少量新的輸入 因此最佳化重點不是去重,而是上下文結構設計。 上下文膨脹的三重機制 三個機制互相疊加: 1、大量工具輸出被寫入歷史上下文 2、工具迴圈會產生大量短間隔呼叫 3、字首變化很小 → cache 每次都會重新讀取 如果 context compaction 沒有穩定觸發,問題會迅速放大。 實戰優化策略 對於超大工具輸出: ·保留摘要 ...
免責聲明: 本網站轉載的文章均來源於公開平台,僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利,請聯絡 crypto.news@mexc.com 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證,並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考,不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。

您可能也會喜歡

Bitcoin 挖礦難度在九月再次創下歷史新高

Bitcoin 挖礦難度在九月再次創下歷史新高

這篇文章《比特幣挖礦難度在九月再次創下歷史新高》發表於BitcoinEthereumNews.com。比特幣(BTC)挖礦難度,一個追蹤向分類帳添加新區塊相對挑戰的指標,在週五攀升至142.3兆的歷史新高。挖礦難度在八月和九月連續創下歷史新高,這是由於過去幾週新部署的計算能力湧入所推動。根據CryptoQuant的數據,比特幣的算力,即保障去中心化貨幣協議的總計算能力的平均值,在週五也達到了每秒超過1.1兆次哈希的歷史新高。不斷上升的挖礦難度和對能源密集型高性能計算能力的持續需求,使得個人礦工和企業更難以競爭,引發了比特幣挖礦正變得越來越中心化的擔憂。比特幣網絡難度在九月創下歷史新高。資料來源:CryptoQuant 相關:比特幣挖礦股票表現優於BTC,因投資者押注AI轉型 上市公司正面臨來自政府和能源基礎設施提供商的壓力 小型礦工甚至上市公司正面臨來自政府的日益激烈的競爭,這些政府可以獲取免費能源資源,以及能將比特幣挖礦垂直整合到其業務運營中的能源基礎設施提供商。一些政府已經在挖掘比特幣或探索利用過剩或溢流能源進行挖礦,包括不丹、巴基斯坦和薩爾瓦多。五月,巴基斯坦政府宣布計劃分配2,000兆瓦(MW)的剩餘能源用於比特幣挖礦,作為該國監管轉向擁抱加密貨幣和數字資產的一部分。美國德克薩斯州的能源提供商也正在與德克薩斯州電力可靠性委員會(ERCOT)合作,將比特幣挖礦整合到其基礎設施中,以平衡電力負載。一張圖表顯示2021-2023年德克薩斯州加密礦工在高峰需求期間的能源使用減少情況。資料來源:ERCOT 電網可能會遭受...
分享
BitcoinEthereumNews2025/09/21 05:07
Arm 坦言未提供 Windows 平台GPU 產品 NVIDIA 與聯發科 N1 平台成變數

Arm 坦言未提供 Windows 平台GPU 產品 NVIDIA 與聯發科 N1 平台成變數

Arm 官方坦承其 GPU 無法用於 Windows,為 NVIDIA 與聯發科合作的 N1 平台鋪路。此平台將成 Windows on Arm 生態發展的關鍵變數,挑戰高通獨佔並解決繪圖效能瓶頸。
分享
Cool3c2026/03/10 20:43
韓檢被盜 320 枚比特幣「失而復得」,火速套現 2,150 萬美元繳國庫

韓檢被盜 320 枚比特幣「失而復得」,火速套現 2,150 萬美元繳國庫

根據韓媒報導,韓國光州地檢署已將先前「丟失」的 320.8 枚比特幣全數出售,套現 316 億韓元(約 2,150 萬美元),並全數上繳國庫。 〈韓檢被盜 320 枚比特幣「失而復得」,火速套現 2,150 萬美元繳國庫〉這篇文章最早發佈於《區塊客》。
分享
Blockcast2026/03/10 20:44