題 目:淺談深度學習在圖像復原與合成中的應用
時 間:2023年4月5日 周三 17:00-18:30
地 點:騰訊會議(會議號:140-254-977)
主辦單位:西南石油大學 科研處 計算機科學學院
主講人:張宇倫
內容簡介:基于深度學習的圖像復原與合成,在當今計算機視覺領域扮演著基礎而重要的角色。相關技術被廣泛應用到移動設備(比如,手機)或者催生一批高估值創業公司。然而,如何設計高效的深度卷積神經網絡,以此來提取更高質量的特征,進行更好的圖像復原與合成,仍然頗具挑戰性。此次報告,我將介紹我們近期在通道與空間維度上增強深度特征的一些工作。對于圖像復原,我先簡述我們提出的殘差密集網絡,然后介紹residual in residual (RIR)結構來訓練非常深的圖像超分辨率網絡。這種RIR結構使得網絡能學習到更多高頻信息,這種信息對重構高質量輸出至關重要。之后,我將探索注意力機制(比如,通道和空間注意力,Transformer,Diffusion等)在圖像復原任務中的應用。對于圖像合成,我將介紹基于圖割的多峰風格變換。我們將高維深度特征進行降維并且可視化,以此發現了風格深度特征的多峰分布現象。進而將風格匹配問題歸結為能量最小化問題并用圖割的方法來求解該問題。因此,圖像匹配中變換后的特征包含了更多空間語義信息,能提供更多視覺效果更好的風格化效果。此外,我們還探索了高放大倍數下,關于紋理遷移的圖像合成問題。最后,我將結合我們近期的一些相關工作(比如,生物醫學圖像分析,模型剪枝與量化等),給出一些個人的淺見和展望。
主講人簡介:張宇倫,蘇黎世聯邦理工學院計算機視覺實驗室博士后研究員。2009-2013年,本科就讀于西安電子科技大學電子工程學院智能科學與技術專業。2014-2017年,碩士就讀于清華大學自動化系,碩士期間曾在南洋理工大學,悉尼大學及中科院深圳先進技術研究院等機構從事訪問研究。2017-2021年,博士就讀于美國東北大學電子與計算機工程系。博士期間,先后在Adobe與哈佛大學從事實習和訪問研究。他的主要研究方向是圖像/視頻復原與合成,生物醫學圖像分析,模型壓縮,計算成像等。他目前在計算機視覺,機器學習,多媒體等領域的國際期刊(如TPAMI)和會議(如CVPR, ICCV, ECCV, ICLR, NeurIPS)上發表學術論文60余篇。目前,谷歌學術引用11000余次,單篇一作論文引用3200余次。獲得6項中國授權專利和3項美國授權專利,專利技術被應用到Adobe Photoshop軟件。獲得2015年IEEE VCIP最佳學生論文獎,2019年 IEEE ICCV RLQ Workshop最佳論文獎。擔任CVPR 2023, ICCV 2023, NeurIPS 2023領域主席(AC),IJCAI 2021-2023, AAAI 2023資深程序委員(SPC),NTIRE Workshop組織者之一,TPAMI, IJCV, ICCV, ECCV, ICLR, NeurIPS, ICML等期刊和會議審稿人。