\ 這種轉變比任何人預測的都要快。有一天,AI 還在自動完成我們的句子。第二天,它就開始參加我們的會議,總結我們的對話,並代表我們起草後續訊息。現在它正在做決策。
我花了數年時間研究團隊如何通過智能平台協作,而我今天所見證的是自電子郵件引入以來工作場所動態最重大的轉變。AI 代理不再只是我們使用的工具。它們是我們並肩工作的參與者。
這種區別對 UX 研究人員來說非常重要。當軟體開始表現得像團隊成員時,我們開發的評估軟體功能的方法就不再適用。
傳統的 UX 研究會問這樣的問題:這個功能容易被發現嗎?交互是否直觀?它是否減少了工作流程中的摩擦?
這些問題假設 AI 是被動的,在回應前等待用戶輸入。但 AI 代理的運作方式不同。它們觀察、解釋、決策和行動。根據 MIT Sloan Management Review 和波士頓諮詢集團 2025 年的研究,35% 的組織已經開始使用主動型 AI,另有 44% 計劃很快採用。然而,47% 表示他們沒有關於如何使用 AI 的策略。這種採用與理解之間的差距正是 UX 研究必須介入的地方。
當 AI 代理加入協作平台時,它改變了團隊的社交動態。它影響誰說話,何時說話,以及他們感到舒適說什麼。評估這些轉變需要遠超可用性測試的方法。
\ 
在我領導智能協作平台的 UX 研究工作中,我開發了專門為企業環境中運作的 AI 代理設計的評估框架。這項工作位於產品策略、AI 開發和人因研究的交叉點。
在這種情況下,AI 評估與傳統模型基準測試有根本不同。當 AI 代理在協作平台內運作時,我們不能簡單地孤立地測量準確性或回應質量。我們必須評估代理在真實團隊的複雜社交和運營動態中的表現。
我通過三個相互關聯的層面來處理企業協作的 AI 評估。第一層檢查功能性能:代理是否正確識別行動項目,準確總結討論,並在適當時刻提供相關信息?第二層評估整合質量:代理如何在現有工作流程中無縫運作,不產生摩擦或要求用戶改變行為?第三層,也是最常被忽視的一層,評估系統性影響:代理的存在如何隨時間影響團隊動態、決策質量和協作效果?
哈佛商業評論 2025 年 5 月的研究將 AI 代理描述為代表新興人才類別的「數字隊友」。這種框架要求我們評估 AI 代理不僅僅是完成任務,還要評估它們作為團隊參與者的功能。我的評估協議包含行為觀察、縱向跟踪和結果分析,這些都是傳統 AI 基準完全忽略的。
取得最強結果的組織是那些將 UX 研究直接嵌入到 AI 評估週期中的組織,將以人為中心的指標與技術性能指標一起使用。
\
企業協作平台的下一個前沿是能夠適應個別用戶、團隊文化和組織環境的超個性化 AI 代理。這是 UX 研究不僅具有評估性而且具有生成性的地方,直接塑造這些代理的設計和部署方式。
我一直在領導研究計劃,為協作平台上個性化 AI 代理的戰略發展提供信息。這項工作涉及了解不同用戶類型與 AI 互動的特定模式,團隊溝通風格如何在不同功能和地理位置上變化,以及組織文化如何影響用戶對 AI 協助的期望。
麥肯錫 2025 年 11 月關於 AI 合作夥伴關係的研究指出,實現 AI 潛力需要重新設計工作流程,使人員、代理和機器人能夠有效協作。從產品策略角度來看,這意味著 AI 代理不能一刀切。它們必須根據用戶偏好和環境因素調整其溝通風格、干預頻率和自主程度。
我的研究已經確定了在企業協作環境中最重要的幾個個性化維度。溝通風格匹配確保代理反映用戶自然表達自己的方式,無論是正式還是隨意,詳細還是簡潔。干預時機校準學習個別用戶何時偏好主動協助,何時希望不受干擾地工作。信任閾值調整認識到不同用戶對 AI 自主性有不同的舒適度,並相應地進行校準。
戰略意義重大。為協作平台構建 AI 代理的產品團隊需要持續的 UX 研究輸入,以了解個性化功能在不同用戶群體中的表現。沒有這種研究基礎,個性化努力可能會創建對某些用戶感覺侵入性而對其他用戶似乎無用的代理。
通過對採用 AI 代理進行協作工作流程的跨職能團隊進行廣泛的實地研究,我開發了一個評估框架,圍繞傳統方法忽視的四個維度構建。
我最近對一個分佈式產品團隊進行了為期八週的研究,該團隊在其協作平台上實施了 AI 代理。該代理被設計為參加會議、生成摘要、跟踪決策並主動提供相關信息。
初始指標看起來很出色:94% 的行動項目準確率,4.2/5 的滿意度評分。但行為觀察揭示了儀表板看不見的問題。會議時間降低了 18%,因為團隊成員匆忙討論,意識到每個字都被記錄下來。到第三週,一個歸因錯誤觸發了驗證負擔,消耗的時間比它替代的文檔更多。團隊成員還發展出我稱之為「摘要依賴綜合症」的情況,完全依賴 AI 摘要而錯過關鍵背景。
基於這些發現,團隊重新配置了 AI 代理,將其功能範圍減少了 60%。他們移除了主動功能,同時保留了準確度高的文檔任務。傳統採用指標會將此標記為失敗。但團隊效能指標講述了不同的故事:決策質量提高,會議參與變得更加公平,驗證負擔降低到可持續水平。
最重要的發現來自訪談。多位團隊成員描述在完全自主階段感到「被監視」。這種對真實溝通的冷卻效應從未出現在任何儀表板指標中。
\ 
\
基於這項研究和類似研究,我推薦以下方法來評估協作環境中的 AI 代理。
AI 代理將在企業協作中無處不在。研究問題不是組織是否會採用它們,而是如何有效地整合它們。
UX 研究人員在塑造這種整合方面扮演著關鍵角色。我們擁有理解人類行為的方法和評估體驗質量的框架。做對這一點的組織將建立人類和 AI 代理真正互補的協作系統。那些將 AI 代理視為另一個功能的組織將發現他們的團隊比技術到來之前工作效率更低。
\


