報告題目:細粒度視覺分類與檢索
報告人:彭宇新
主持人:趙世杰
報告時間:2021年11月11日(周四)晚上19:00
報告地點:騰訊會議ID:127 470 024
報告簡介:
與一般的視覺分類不同,細粒度視覺分類旨在對粗粒度的大類(如鳥、車等)進行細粒度的子類劃分(如大冠蠅霸鹟、阿卡迪亞霸鹟、藍鹀等鳥類子類別;奧迪A6、A8等車類子類別),其挑戰在于外形、顏色等相似導致的不同類別差異小,姿態、視角等不同導致的相同類別差異大。如何借鑒人腦的認知機理,模擬視覺注意力機制學習多粒度的辨識性特征,突破細粒度視覺分類難題,對于提高計算機的感知和認知能力至關重要。本報告將介紹我們在細粒度視覺分類上的相關研究進展,包括空間拓撲注意力學習、堆疊式深度強化學習、層次化深度增量遷移學習等方法,以及我們在細粒度跨媒體檢索上的探索,實現了由圖像、視頻到跨媒體的擴展,由分類到檢索的擴展。
報告人簡歷:
彭宇新,北京大學二級教授、博士生導師、國家杰出青年科學基金獲得者、國家級高層次人才計劃入選者、中國人工智能產業創新聯盟專家委員會主任、中國工程院“人工智能2.0”規劃專家委員會專家、北京圖象圖形學學會副理事長、中國圖象圖形學學會副秘書長。主要研究方向為跨媒體分析與推理、圖像視頻識別與理解、計算機視覺、人工智能。以第一完成人獲2016年北京市技術發明一等獎和2020年中國電子學會科技進步一等獎,2008年獲北京大學寶鋼獎教金優秀獎,2017年獲北京大學教學優秀獎。主持了863、國家自然科學基金等20多個項目,發表論文160多篇,包括ACM/IEEE Trans和CCF A類論文70多篇。多次參加由美國國家標準技術局NIST舉辦的國際評測TRECVID視頻樣例搜索比賽,均獲第一名。主持研發的跨媒體互聯網內容分析與識別系統已經應用于公安部、工信部、國家廣播電視總局等單位。擔任IEEE TCSVT等期刊編委。