企業人工智慧公司 凝聚力 宣布發布 Command A+,這是一款開源的混合專家語言模型,專為計算需求相對較低的企業級智能體任務而設計。
該公司表示,該模型建立在 Cohere 的企業工作空間 North(用於開發和部署智慧 AI 系統)一年的工作基礎上,並將 Command 系列的功能整合到單一模型中,旨在用於實驗、部署和生產環境的可擴展使用。
Command A+ 現已採用 Apache 2.0 授權發布,開發者可以廣泛使用此模式。 Cohere 表示,該模型旨在支援自主 AI 部署,包括那些希望直接控制基礎架構和模型行為的組織環境。此次發布包含 Hugging Face 的可下載權重,以及透過 Cohere 模型庫提供的實施指南和部署選項。
根據該公司公佈的規格說明,該模型採用稀疏的MoE架構,總共有218億個參數,其中25億個參數處於激活狀態,支援128,000萬個詞元的輸入上下文,並可產生多達64,000萬個詞元。它專為文字、圖像和工具使用輸入而設計,並能以48種語言產生文字、推理和工具使用輸出。
Cohere公司表示,Command A+模型針對推理、檢索增強生成、多語言任務、多模態文件處理和智慧體工作流程進行了最佳化。該公司還強調了其硬體效率,指出該模型支援多種量化格式,包括BF16、FP8和W4A4,並且可以在少量高階GPU上運行。該模型也被譽為Cohere迄今速度最快的版本,與先前的Command模型相比,其輸出速度更快、延遲更低、詞元效率更高。 Cohere表示,該模型架構採用了推測性解碼技術,可在不影響輸出品質的前提下進一步提升推理速度。
該公司將 Command A+ 描述為早期 Command A 變體的整合升級版,並表示其在面向企業的任務(例如長上下文推理、多模態理解、檢索和代碼生成)方面超越了前幾代產品。 Cohere 也強調了 Command A+ 相較於 Command A Reasoning 的基準測試優勢,包括在電信相關的智能體評估、基於終端的編碼任務以及 North 內部使用的指標方面表現更佳。此外,該模型也被認為能夠提升電子表格分析、智慧體問答和基於記憶體的工作流程的效能。
多語言功能是這次版本更新的另一個亮點。 Cohere公司表示,Command A+將支援的語言從23種擴展到48種,同時提升了翻譯和多語言推理效能。該公司還報告稱,在非歐洲語言方面也取得了進步,包括阿拉伯語、韓語和日語的詞法分析效率有所提高。在多模態基準測試中,模型在文件和影像推理任務上表現更佳,包括MathVista、MMMU和CharXiv相關的評估。
業界對此發布的關注度在富士通的評論中可見一斑。富士通表示,該模型的架構和智能體性能與其自身的自主人工智慧策略相契合。 Cohere 將此次發布視為其更廣泛舉措的一部分,旨在同時解決企業人工智慧領域的三大優先事項:能力、安全性和成本。該公司表示,未來的開發將繼續專注於推理、多模態性能和編碼,同時確保模型適用於在客戶可控的環境中部署。
Command A+ 可透過 Hugging Face、Model Vault、Cohere 的 API 以及免費線上演示平台取得。 Cohere 表示,他們還為希望測試該模型或將其整合到企業工作流程中的組織提供文件和部署材料。
Source link

