Google 與非洲研究機構聯盟推出了 WAXAL 數據集,這是一項重大的新舉措… 這篇文章 Google 將以 21 種非洲語言訓練 AIGoogle 與非洲研究機構聯盟推出了 WAXAL 數據集,這是一項重大的新舉措… 這篇文章 Google 將以 21 種非洲語言訓練 AI

Google 將以 21 種非洲語言訓練 AI,包括約魯巴語、豪薩語和伊博語

Google 與非洲研究機構聯盟推出了 WAXAL 資料集,這是一項重大的新計畫,旨在解決人工智慧(AI)在非洲大陸面臨的主要挑戰之一,即無法解釋和理解大多數非洲語言。

該專案提供了一個大型開放語音資料集,涵蓋 21 種撒哈拉以南非洲語言,並為超過 1 億被排除在 AI 經濟之外的人們帶來語音技術。

WAXAL 資料集是由 Google 資助、當地大學和社群團體領導的三年合作成果。

它包含 1,250 小時的轉錄自然語音和超過 20 小時的錄音室級錄音,旨在建立高保真合成語音。它針對豪薩語、約魯巴語、盧干達語、伊博語和阿喬利語等語言,其中許多語言有數千萬人使用,但在商業語音系統中仍然基本上不可見。

Google 與非洲大學推出 WAXAL 資料集,以訓練 AI 理解 21 種非洲語言,包括約魯巴語、豪薩語和伊博語

儘管有關全球 AI 的討論很多,但語音技術仍然嚴重偏向英語以及少數歐洲和亞洲語言。非洲擁有超過 2,000 種語言,卻一直被邊緣化。

這種差距不僅是學術性的;它決定了誰可以使用數位服務、誰可以取得教育和醫療保健工具,以及誰能在現代 AI 平台上建立公司。Google 將這項工作定位為縮小長期資料差距的一步,這種差距使許多非洲語言無法出現在語音助理和其他工具上。

為什麼 WAXAL 資料集對非洲 AI 架構很重要

除了直接解決這種不平衡之外,該專案本身與資料同樣重要。

與早期非洲語音資料被提取並歸其他地方所有的計畫不同,WAXAL 由非洲機構在當地領導。烏干達的馬凱雷雷大學、迦納大學和盧安達的 Digital Umuganda 監督資料收集、社群參與和語言管理,並獲得 Google Research Africa 的技術支援。

至關重要的是,這些機構保留了資料的所有權。這在一個經常因在開放旗幟下複製掠奪性動態而受到批評的領域中是一個顯著的轉變。

根據 Google Research Africa 負責人 Aisha Walcott-Bryant 的說法:「WAXAL 的最終影響是賦予非洲人民權力。這個資料集為學生、研究人員和企業家提供了關鍵基礎,讓他們能夠按照自己的條件、使用自己的語言建立技術,最終觸及超過 1 億人。」

她補充說:「我們期待看到非洲創新者使用這些資料創造一切,從新的教育工具到語音啟用服務,在整個非洲大陸創造實實在在的經濟機會。」

Google 與非洲大學推出 WAXAL 資料集,以訓練 AI 理解 21 種非洲語言,包括約魯巴語、豪薩語和伊博語Aisha Walcott-Bryant,Google Research Africa 負責人

參與的大學也呼應了這一框架。馬凱雷雷大學高級講師 Joyce Nakatumba-Nabende 表示:

「要讓 AI 在非洲產生真正的影響,它必須說我們的語言並理解我們的背景。WAXAL 資料集為我們的研究人員提供了建立反映我們獨特社群的語音技術所需的高品質資料。在烏干達,它已經增強了我們當地的研究能力,並支援了由學生和教職員領導的新專案。」

在迦納大學,副教授 Isaac Wiafe 指出公眾參與的規模:

「對我們迦納大學來說,WAXAL 的影響超越了資料本身。它賦予了我們建立自己的語言資源和培養新一代 AI 研究人員的能力。超過 7,000 名志願者加入我們,因為他們希望自己的聲音和語言屬於數位未來。今天,這種集體努力在健康、教育和農業等領域激發了創新生態系統。這證明了當資料存在時,可能性就會到處擴展。」

有理由持謹慎樂觀態度。開放語音資料集可以降低缺乏大規模收集資料資源的當地新創企業和研究人員的障礙。它們還可以減少對外國 API 的依賴,這些 API 很少能很好地支援非洲語言,即使有也是如此。

Google 與非洲大學推出 WAXAL 資料集,以訓練 AI 理解 21 種非洲語言,包括約魯巴語、豪薩語和伊博語WAXAL 資料集

儘管如此,資料集並不能保證結果;建立可靠的語音系統需要持續投資、本地部署以及將價值留在國內的商業途徑。Google 作為資助者和召集人的角色將受到審查,特別是關於 WAXAL 資料未來如何被全球公司使用。

目前,WAXAL 資料集的發布標誌著朝向更具語言包容性的 AI 生態系統邁出了具體的一步。它並不能解決非洲的 AI 挑戰,但它解決了一個基礎性的挑戰。語音通常是與技術最自然的介面。確保 AI 能夠聽到非洲所有多樣性的聲音,早就該做到了。

這篇文章《Google 訓練 AI 理解 21 種非洲語言,包括約魯巴語、豪薩語和伊博語》首次發表於 Technext。

免責聲明: 本網站轉載的文章均來源於公開平台,僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利,請聯絡 service@support.mexc.com 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證,並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考,不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。