活动
禤永明系統工程與工程管理學教授蒙美玲教授就職演講:「跨越數碼鴻溝 ― 打造普惠公平的語音語言技術」
2021年12月7日
下午4時正
香港中文大學大學行政樓地下祖堯堂
蒙美玲教授
蒙美玲教授是香港中文大學禤永明系統工程與工程管理學教授。她於多語言及多模態人機交互及語言學習技術等領域作出了重要貢獻。2013年,她成立了中大何鴻燊海量數據決策分析研究中心,並擔任主任。2019年,她的跨學科研究團隊獲得香港特別行政區政府研究資助局頒發的第一個人工智能主題研究計劃項目。2020年,她協助建立博智感知交互研究中心有限公司 — 這是由中大牽頭,設於香港科技園的人工智能創新中心。她是中大賽馬會「智」為未來計劃的計劃副負責人及課程發展組主領,開發了香港首套切合初中程度的人工智能教育課程。蒙教授曾多次在大型會議上發表主題演講,包括2021年IEEE ICASSP 的大會報告、2021年ACL的主題報告,和2018年INTERSPEECH的大會報告。蒙教授於2013年獲選為IEEE院士;於2016年當選ISCA院士(全球81名院士之一);並於早年當選為香港工程師學會(HKIE)院士和香港電腦學會(HKCS)院士。歷年來,蒙教授獲獎甚多,包括2021年SciTech Challenge科技挑戰賽冠軍、2017年傑出專業女性大獎(自1999年以來的20名得獎者之一)、2016年微軟研究院傑出合作者獎(全球32位學者之一)、2016年IBM傑出學者獎、2015年ISCA傑出講師、2015年香港電腦學會(HKCS)首屆資訊及通訊科技傑出女仕獎、2012年APSIPA首屆傑出講師、2009年教育部高等學校科學研究優秀成果獎(科學技術)、2008年清華大學深圳研究生院(現為清華大學深圳國際研究生院)「鵬城學者」特聘教授、香港中文大學工程學院的模範教學獎、青年研究員獎和服務獎,以及多個傑出論文獎等。
蒙教授在麻省理工學院獲得學士、碩士及博士學位。她於1998年加入香港中文大學,為系統工程與工程管理學系的首位女教授,並於1999年在學系成立人機通訊實驗室。除此以外,她在2005年創辦微軟—香港中文大學利群計算及界面科技聯合實驗室,並擔任主任。該實驗室自2008年起被升格為中國教育部(MoE)重點實驗室。2006年,她創立了清華大學—香港中文大學媒體科學、技術與系統聯合研究中心。2007年,她助力中大及中國科學院深圳先進集成技術研究所聯合創辦環境智能與多模態系統實驗室。在2012至2013年,她作為香港中文大學(深圳)學術規劃小組委員會的成員,率先為課程設計做出早期貢獻,此後一直擔任其兼職教授。蒙教授於2006至2010年擔任工程學院副院長(研究),並於2012至2018年擔任工程學院的首位女系主任。
蒙教授多年來都致力於國際和地區的專業服務。她曾被選為IEEE SPS Transaction on Audio, Speech and Language Processing(被譽為是該領域最負盛名的期刊)的總主編。她正在或曾經擔任的職位包括:IEEE SPS理事會、提名和任命委員會和獎項委員會成員;ISCA委員會委員及其國際諮詢委員會委員。此外,她亦擔任瑞典研究委員會歐洲研究基礎設施計劃小組,和瑞士國家科學基金會的國家研究能力中心成員。於2014年,她擔任ISCA旗艦會議INTERSPEECH大會的技術主席,再於2020年出任INTERSPEECH首屆在線會議的大會主席。她獲得了2019年IEEE SPS Leo L. Beranek功勳服務獎,以表彰她在服務及領導上的貢獻。
在區域方面,她當選為中國計算機學會的語音、對話及音頻專家組常務委員,並獲委任為香港特別行政區政府研究資助局成員,及本地自資學位界別競逐研究資助計劃評審委員會主席,香港科技園公司数字顾问委员会成員,以及AI4SDGs(AI for Sustainable Development Goals)合作網絡下AI for Children工作組的受邀成員。她曾任香港特別行政區政府電子健康紀錄互通督導委員會委員、職業訓練局創新及科技訓練委員會委員、香港/廣東省資訊及通訊科技專家委員會成員和大數據研究及應用工作小組協調人、香港公開大學(現稱爲香港都會大學)理事會成員、香港生產力促進局理事會成員、香港特區政府數碼21資訊科技策略諮詢委員會委員,以及資訊科技界人力調查工作小組主席。她也是何鴻燊博士醫療拓展基金會信托委員會成員。
網上登記, 請按此。
3943 8677
人工智能和深度神經網絡的加速發展推動了語音和語言技術在虛擬助手、智能音箱、閱讀機等多種應用的普及。這些技術的出色表現使得語音識別的準確度及語音合成的自然度都接近人類的水平。隨著這些技術不斷地融入到我們的日常生活,它們更需要支援多元化的、非主流的用戶和應用環境,包括非母語使用者的發音、語碼轉換、包含各種情緒和風格的語音、以及言語障礙和言語失調者的話語。在這些情況下,現有技術往往會出現性能下降,從而無法滿足用戶的需求。這個問題的關鍵,在於數據的稀缺性和稀疏性,而這數據上的挑戰亦會因數據的高變動性而進一步加劇。
本講座將概述我們在語音處理的各個階段用來解決數據短缺的一些方法,包括基於語音信號擾動的數據增強、使用預訓練表徵、學習語音表徵的解耦、知識蒸餾架構、元學習模型重初始化,以及對抗訓練模型。這些方法的有效性已通過各種應用得到證明,包括口音語音識別,構音障礙語音識別,語碼轉換的語音合成,失調語音重建,單樣本語音轉換和基於樣例的情感語音合成。我們致力開發的語音和語言技術,可以優雅地配合多元化的用戶和應用環境的需求,以達至普惠公平,跨越數碼鴻溝的目標。