OpenAI 發布 GPT-5.4,API 上下文視窗擴展至 100 萬 token。其透過工具搜尋優化效率、降低錯誤率,並確保思維鏈透明度,提升專業任務的效能與可靠性。OpenAI 發布 GPT-5.4,API 上下文視窗擴展至 100 萬 token。其透過工具搜尋優化效率、降低錯誤率,並確保思維鏈透明度,提升專業任務的效能與可靠性。

OpenAI 發表 GPT-5.4 基礎模型:推出 Pro 與 Thinking 版本,事實錯誤率降低 33%

2026/03/06 12:25
閱讀時長 5 分鐘
如需對本內容提供反饋或相關疑問,請通過郵箱 crypto.news@mexc.com 聯絡我們。

OpenAI 於週四推出 GPT-5.4 全新基礎模型,定位為當前最強大且兼顧效率的專業生產力工具。為了滿足不同領域的垂直需求,該系列細分為強調深度推理的 「GPT-5.4 Thinking」 與追求極致效能的 「GPT-5.4 Pro」。在技術指標方面,此版本的 API 支援高達 100 萬個 token 的上下文視窗,為 OpenAI 迄今提供的最大容量,這項規格提升使其在處理大規模企業數據與長篇文件時,具備更穩定的資訊保留能力。

在商務應用實務上,GPT-5.4 展現出顯著的跨領域競爭力,於法律分析、財務精算及長週期專案(如多頁面簡報開發)的基準測試中均取得領先地位。合作方 Mercor 執行長 Brendan Foody 指出,與現有其他前沿模型相比, GPT-5.4 在處理高複雜度邏輯任務時,不僅運行速度更快,且具備成本優勢,能有效因應專業人士處理龐雜數據時的效率挑戰。

技術底層的優化也是本次改版的亮點

OpenAI 透過「權杖效率優化」與新開發的「工具搜尋」(Tool Search)機制,徹底翻轉了過往 API 呼叫時需預載海量指令的資源浪費,新系統讓模型在需要時才查找工具定義,大幅減少了不必要的運算損耗,為建構更複雜、更敏捷的 AI 代理(AI Agents)系統掃平了障礙。

在減少「 AI 幻覺」與提升資訊可靠性方面,數據顯示 GPT-5.4 在單項事實主張的錯誤率較 GPT-5.2 降低了 33%,整體回覆的出錯率則下降 18%。對於金融與法務等低容錯率領域,這項進展顯著提升了生成式 AI 處理嚴謹專業內容的適用性。

在 AI 安全性與透明度方面, OpenAI 引入了針對「思維鏈」(Chain-of-Thought)的全新評估機制。研究顯示,GPT-5.4 Thinking 在執行任務時,其推論過程展現出高透明度,目前數據尚未發現該模型有能力隱藏或誤導其邏輯路徑。

以上這項評估結果初步緩解了學界對推理模型可能產生欺騙行為的擔憂,並顯示「思維鏈監控」在未來的 AI 監管架構中,仍是防範技術風險的關鍵工具。

責任編輯:Claire

核稿編輯:Sisley

本文初稿由 INSIDE 使用 AI 協助編撰,並經人工審校確認;加入 INSIDE 會員,獨享 INSIDE 科技趨勢電子報,點擊立刻成為會員

延伸閱讀:

  • 軍事協議引發 AI 兩巨頭論戰: Anthropic 質疑 OpenAI 合約安全紅線
  • NVIDIA 策略性撤出 OpenAI 與 Anthropic 投資,黃仁勳「IPO 門檻論」難掩 AI 生態系裂痕
  • 替被美國政府列入黑名單的 Anthropic 求情?OpenAI 執行長 Altman 在打的算盤
市場機遇
4 圖標
4實時價格 (4)
$0.008811
$0.008811$0.008811
-3.02%
USD
4 (4) 實時價格圖表
免責聲明: 本網站轉載的文章均來源於公開平台,僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利,請聯絡 crypto.news@mexc.com 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證,並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考,不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。