
(相關資料圖)
7月6日消息,2023世界人工智能大會開幕式上,香港中文大學湯曉鷗教授回顧了在大模型中,中國學者所做的原創的貢獻。
例如,他的學生王曉剛2011-13年在CVPR和ICG兩個視覺最重要的會議上,全球共有29篇文章做深度學習,其中有14篇出自他們實驗室。當時,團隊的18項工作在全世界第一次將深度學習用到視覺問題上,包括人臉識別、人臉檢測、人臉重建、物體檢測、人體姿態等計算機視覺最核心的問題。
此外,湯曉鷗談到,2009年學生何愷明博士曾在碩士期間取得了CVPR最佳論文,這是CVPR25年歷史上從亞洲出來的第一篇最佳論文。此后,何愷明在微軟和Facebook工作后,還解決的深度網絡梯度傳遞的問題,獲得了2016年的最佳論文。在此基礎上,人們可以有效的訓練超過百層的深度學習,在大模型時代,以Transformer為核心的大模型,包括GPT系列,普遍采用了這個結構。
湯曉鷗表示,兩周前,我們自動駕駛大模型從9155篇文章中脫穎而出,獲得了CVPR2023年的最佳論文獎。根據谷歌學術統計,這是改革開放40多年來第一篇全部由中國學者完成的國際計算機視覺三大頂級論壇最佳論文。(湯姆)
關鍵詞: