報告題目:大模型蒸餾技術
報 告 人:茍建平 教授
報告時間:5月21日 17:00-19:00
報告地點:明理樓B區306
報告人簡介:
茍建平,西南大學教授,博士生導師,悉尼大學博士后。從事模式識別與機器學習方面研究。在IJCV、ACM/IEEE Trans等國內外期刊和會議上發表學術論文140余篇,SCI收錄90余篇,高被引用論文4篇,熱點論文1篇,單篇Google引用2200余次。主持包括國家自然基金面上在內的項目共計6項,授權國家發明專利10余項,獲川渝科技學術大會優秀論文一等獎,江蘇省科學技術三等獎和中國醫院協會醫院科技創新三等獎1項。入選江蘇省高校青藍工程優秀青年骨干教師培育人選,中國博士后國際交流計劃派出項目人選和重慶市留學人員回國創業創新支持計劃。
報告內容摘要:
知識蒸餾是一種簡單有效的大模型壓縮技術,報告在簡要回顧大模型和模型壓縮基礎上,詳細介紹模型蒸餾理論、算法和應用,以及相關工作展望。
主辦單位:計算機與軟件學院
科學技術發展研究院