Meta公布大規模多語言語音模型,可辨識超過4000種口語用於AR及VR

Facebook的母公司Meta近日宣布了其旗下大規模多語言語音模型的新進展,該模型可以辨識超過4000種口語表達的語言,這一數字是現有技術的40倍。此外,文字語音互轉技術的應用範圍也從100種語言擴展至1100種語言,並可應用於擴增實境(AR)和虛擬實境(VR)等領域。

眾所周知,許多語言正面臨消失的威脅。Meta指出,他們最近發表的一系列AI模型,旨在幫助用戶以自己習慣的語言更輕鬆地獲取資訊和使用電子裝置。

Meta開發的大規模多語言語音(Massively Multilingual Speech,簡稱MMS)模型擴展了文字轉語音和語音轉文字技術的應用範圍。從最初的100種語言至今,這一數字已經增加到超過1100種語言,是過去的10倍。此外,它還能辨識超過4000種口語語言,是過去的40倍。

Meta表示,他們將開源這項技術的原始碼和模型,以便研究社群能夠基於現有的工作成果進行進一步的開發。這一舉措有助於保存世界各地的語言,並拉近人與人之間的距離。

關於開發語音模型有一個小花絮,因為要讓AI學會更多語言,首要挑戰就是得收集那種語言的語音訓練資料。為了克服這一挑戰,Meta利用已經被翻譯成多種語言且廣泛閱讀和研究的宗教經典:《聖經》。Meta蒐集超過1100種語言的「新約聖經」有聲讀物資料集來讓AI模型學語文。

看更多:Facebook母公司Meta宣布推出AI支援閩南語、英語即時互譯系統,負責工程師來自台灣

(完)


[自問自答x互問互答]

看完文章->自問自答->留言紀錄問題與答案->別人看到你的問題可能會覺得這是個好問題->別人看到你的答案可能會覺得還有別的答案->你看到別人的問題與答案時也是類似的反應->互問互答->日復一日->愈學愈多->大家不知不覺就變強了


範例問題:

  1. 許多語言正面臨消失的威脅,你認為保護和保存語言的重要性是什麼?你認為我們應該如何保存世界各地的語言?
  2. Meta開發的大規模多語言語音模型可以辨識超過4000種口語表達的語言。你覺得這項技術對於人與人之間的溝通有何影響?它如何幫助人們更輕鬆地獲取資訊和使用電子裝置?
  3. 開發語音模型的挑戰之一是蒐集不同語言的語音訓練資料。你認為利用《聖經》進行訓練是一個好的方法嗎?你覺得這種方法在保護語言多樣性和文化傳承方面有何利弊?

你也問問看……

smiley小傳媒編輯團隊希望幫助小學生提升寫作力
若你有作文、新詩、讀書心得、電影觀後感、遊記、小日記…… 等希望得到修改與建議,
或有相關作品希望公開發表,歡迎寄到編輯信箱:editor@kidsmedia.com.tw

延伸閱讀

發表迴響

探索更多來自 KidsMedia 的內容

立即訂閱即可持續閱讀,還能取得所有封存文章。

Continue reading