懂聽能說的人工智能

2022年5月16日

懂聽能說的人工智能

2022年5月16日
分享
列印

電腦是只有0和1的世界,卻懂得聽和說複雜的人類語言,這全靠一眾工程師推動口語語言處理技術的發展,令人類與機器之間的溝通不再困難。

蒙美玲教授研究語言處理技術多年,她透過引入人工智能及深度學習等技術,讓電腦學懂分析人類語言,知曉語音背後隱藏的資訊,包括語意、性別、情緒、語言程度,甚至是教育及健康水平等,並研發輔助工具改善人類的生活和學習。

辨識口語語音中的隱藏資訊 找出認知障礙

 如今科技發達,智慧語音助理可以與手機用戶交談,幫忙回覆訊息、安排行程甚至推薦電影、聽音樂、買書等。近年,語音識別技術更開始應用於醫療檢測,蒙教授是此領域的先驅。在2019年,她和她的團隊開展了「以人工智能提取和鑑定口語生物標誌物供神經認知障礙篩查和監測的研究及技術開發」項目,目標是發掘語音中隱藏的認知健康資訊。

「藉着一些語音測試,我們發現認知功能較好的人,能夠順暢的溝通;相反,認知能力比較弱的人,溝通能力會下降。我們正在編寫手機應用程式,透過定期收集長者的語音,開發人工智能技術,分析他們談話的特徵,旨在及早辨識認知障礙症。」

其實,早在2013年蒙教授已經開始探索人工智能如何能夠應用在醫療相關的課題。她成立了香港中文大學何鴻燊海量數據決策分析研究中心;到2020年參與InnoHK創新香港研發平台,協助建立博智感知交互研究中心,目標是以大數據支持機器學習,進行各類具前瞻性的人工智能研究,造福社會,改善人類生活。

她研究的其他項目包括針對因中風、腦癱等患上構音障礙(Dysarthria)的病人,以電腦模型分析其粵語發音、韻律特質,開發能夠重建障礙語音輸出正常語音的人工智能技術。「語音障礙人士在日常溝通容易碰壁,語音重建的人工智能技術,可以方便他們日常溝通」。這項技術獲得了香港SciTech Challenge 2021 公開組的冠軍。

蒙教授的研究團隊開發一款名為CogApp的手機應用程式,利用語音識別技術收集並分析長者談話的特徵,以及早辨識腦退化症。

人工智能糾正發音

在語音識別技術出現前,人類與機器的溝通只限於透過鍵盤、滑鼠、觸控螢幕等,將人類語言轉換成電腦指令或代碼。對電腦而言,語音信號只是一連串數字,而這些數字背後分成三個不同維度——音頻、時間和能量。電腦「聆聽」語音的方法,就是分辨語音在這三個維度的特徵,再加以比對語音資料庫的數據,從而得出答案。

蒙教授表示:「在美國讀書時已在思考人與機器的溝通如何可以變得簡單一點,有如人際溝通般自然。雖然想法看似天方夜譚,但研究本是一場反覆試驗,透過不斷嘗試及突破,我們就會看到成績。」近年,人工智能和深度學習技術令口語語言技術,包括語音識別、自然語言處理及語音合成等變得更快更準,準確度在適當的環境下,可達到人類水平。

蒙教授在1997年回港訪問時任中大校長高錕教授及其他學者,這次經歷讓她發現香港的語言環境特別適合研究語音識別技術。

蒙教授在美國麻省理工學院博士畢業之後,除了繼續她的研究,也協助學院的工業表現中心(MIT Industrial Performance Center)撰寫一本名為《Made By Hong Kong》的書,一年回來香港七次,訪問頂尖的工業家及學者,包括時任中大校長高錕教授,瞭解他們對香港創科發展的看法,從中發現了香港的機遇,特別是語音研究這一領域。「香港兩文三語的語言背景,加上港式、英式英語的不同口音,為語音語言的研究提供了一個不可多得的環境。」蒙教授續說。

蒙教授的研究焦點,是推進多樣化的語音語言技術。她創建了「中大人機通訊實驗室」,研究電腦語音識別、語音合成、計算機閱讀理解等新技術,並結合來自心理學、語言學、醫學等不同領域的知識,建立龐大的、帶有廣東話口音的英語語音庫,以及能識別和糾正發音錯誤的人工智能系統。

「我們研發的人工智能系統辨識常見的錯誤發音,例如重中文口音的英語。系統會告知用家錯誤發音的位置,並自動合成正確的語音,方便用家參照及糾正錯誤。」她解釋道。

基於這項技術,蒙教授的學生創立了聲希科技公司,開發一套英語學習系統,用戶可透過手機程式、網頁、小程式等,糾正自己的發音問題,如今每日有逾一百萬人在使用。

 

「人類的說話就如神奇的信號,當中有很多資訊,除了語意,還有情感、健康程度,甚至教育水平,可以讓機器分析。當下,我會致力於人工智能的研究,解讀各樣隱藏在語音中的信息,為人類謀福祉。」

— 蒙美玲教授

中大禤永明系統工程與工程管理學教授

研究領域:語音識別系統及多模態系統

主要成就:

  • DialDoc@ACL(公開測試任務第一名和整體最佳成果獎 (2022)
  • 最成功女性獎 (2022)
  • 香港SciTech Challenge 公開組冠軍(2021)
  • 傑出女性專業大獎得主(2017)
  • 國際語音通訊協會(ISCA)院士(全球81名院士之一)(2016)
  • 微軟研究院傑出合作者獎(全球32位學者之一)(2016)
  • 電機暨電子工程師學會 (IEEE) 院士(2013)
  • 國家教育部高等學校科學研究優秀成果獎 ── 科技進步獎 (2009)