中大新聞中心

2021年11月25日

中大聯同上海人工智能實驗室、商湯科技及上海交通大學 共同發布新通用視覺技術體系「書生」

2021年11月25日
分享
列印

「書生」可以讓 AI 模型處理多樣化的視覺任務

香港中文大學(中大)聯同上海人工智能實驗室、商湯科技(SenseTime)及上海交通大學發布新一代通用視覺技術體系「書生」(INTERN),以解決現時人工智能視覺領域中,AI模型在任務和場景通用性、數據學習效率方面的瓶頸問題,有關技術已於論文發布平台 arXiv 發布。

新系統名為「書生」,寓意系統擁有如書生般的特質,通過持續學習,舉一反三。根據技術測試結果,一個「書生」基礎模型可全面覆蓋分類、目標檢測、語義分割、深度估計四大視覺核心任務。在 ImageNet的 26 個最具代表性的下游場景中,「書生」模型展現了極強的通用性,並顯著提升這些視覺場景的性能。

相比現時最先進的開源模型CLIP(Contrastive Language-Image Pre-Training),「書生」在準確性和數據使用效率方面均大幅提升。應用同樣的下游場景,「書生」在 26 個資料集中,四大任務的平均錯誤率分別降低 40.2%、47.3%、34.8%和 9.4%。其中在數據使用效率方面的提升尤為突出,例如「書生」只需要十分之一的下游資料便能準確識別花卉的種類,比 CLIP以完整下游資料進行分析的準確度更高。

現時的AI 模型只擅長處理一項任務,在新場景、數據學習、新任務的通用性有限,面對不同任務需求,須獨立開發模型。「書生」則可同時完成多項任務,應用於多樣化的場景,包括自動駕駛、智慧製造、智慧城市等。利用這個新系統,業界可以極低成本獲取下游資料,快速驗證多個新場景,體現了產學研合作在通用視覺領域的全新探索,為走向通用人工智能邁出堅實一步。

中大一直重視發展人工智能科學研究與技術應用,人工智能亦是中大策略計劃 2021-2025的重點發展科研領域之一。中大以領先全球的科研優勢為本,著重以跨學科研究結合各方智慧和實力,推動技術創新與突破,造福國家及全球社群。上海人工智能實驗室是國家人工智能領域的新型科研機構,通過積極與海內外知名科研機構及高校開展合作,匯聚與培養國際頂尖人才,共同建設國際一流的人工智能實驗室,加快打造成人工智能原創理論和技術的重要策源地。中大及上海人工智能實驗室於2021年9月合作成立「中大人工智能交叉學科研究所」,深度參與國家十四五規劃的重要科研計劃,為香港建設成為國際創新科技中心作出貢獻。



「書生」可以讓 AI 模型處理多樣化的視覺任務

「書生」可以讓 AI 模型處理多樣化的視覺任務

 

下載所有相片