Meta公布大規模多語言語音模型，可辨識超過4000種口語用於AR及VR

Facebook的母公司Meta近日宣布了其旗下大規模多語言語音模型的新進展，該模型可以辨識超過4000種口語表達的語言，這一數字是現有技術的40倍。此外，文字語音互轉技術的應用範圍也從100種語言擴展至1100種語言，並可應用於擴增實境（AR）和虛擬實境（VR）等領域。

眾所周知，許多語言正面臨消失的威脅。Meta指出，他們最近發表的一系列AI模型，旨在幫助用戶以自己習慣的語言更輕鬆地獲取資訊和使用電子裝置。

Meta開發的大規模多語言語音（Massively Multilingual Speech，簡稱MMS）模型擴展了文字轉語音和語音轉文字技術的應用範圍。從最初的100種語言至今，這一數字已經增加到超過1100種語言，是過去的10倍。此外，它還能辨識超過4000種口語語言，是過去的40倍。

Meta表示，他們將開源這項技術的原始碼和模型，以便研究社群能夠基於現有的工作成果進行進一步的開發。這一舉措有助於保存世界各地的語言，並拉近人與人之間的距離。

關於開發語音模型有一個小花絮，因為要讓AI學會更多語言，首要挑戰就是得收集那種語言的語音訓練資料。為了克服這一挑戰，Meta利用已經被翻譯成多種語言且廣泛閱讀和研究的宗教經典：《聖經》。Meta蒐集超過1100種語言的「新約聖經」有聲讀物資料集來讓AI模型學語文。

（完）

[自問自答x互問互答]

看完文章->自問自答->留言紀錄問題與答案->別人看到你的問題可能會覺得這是個好問題->別人看到你的答案可能會覺得還有別的答案->你看到別人的問題與答案時也是類似的反應->互問互答->日復一日->愈學愈多->大家不知不覺就變強了

範例問題：

許多語言正面臨消失的威脅，你認為保護和保存語言的重要性是什麼？你認為我們應該如何保存世界各地的語言？
Meta開發的大規模多語言語音模型可以辨識超過4000種口語表達的語言。你覺得這項技術對於人與人之間的溝通有何影響？它如何幫助人們更輕鬆地獲取資訊和使用電子裝置？
開發語音模型的挑戰之一是蒐集不同語言的語音訓練資料。你認為利用《聖經》進行訓練是一個好的方法嗎？你覺得這種方法在保護語言多樣性和文化傳承方面有何利弊？
…

你也問問看……

小傳媒編輯團隊希望幫助小學生提升寫作力。
若你有作文、新詩、讀書心得、電影觀後感、遊記、小日記…… 等希望得到修改與建議，
或有相關作品希望公開發表，歡迎寄到編輯信箱：editor@kidsmedia.com.tw

延伸閱讀