3 月 19 日下午,西南石油大學計算機與軟件學院于明理樓 B306 舉辦 “夢溪湖論壇” 系列講座春季第三講,軟件工程專業在讀碩士陳天霖主講,介紹發表于 Pattern Recognition 期刊的論文及投稿歷程。
講座中,陳天霖闡釋多示例學習(MIL)基本概念,即包由多個示例構成,包標簽已知但示例標簽未知,依包內目標示例判定包標簽正負。還介紹了 MIL 算法類型及在多領域的應用,體現其廣泛適用性。
論文聚焦基于代表示例選擇的MIL 嵌入方法,針對現有算法選擇代表示例時忽視數據分布特征差異的問題,指出傳統挖掘方法在原始特征空間處理復雜數據分布有局限,而自適應密度分布挖掘技術可提取數據密度分布特征,確保包的區分能力。同時,傳統嵌入 MIL 算法存在嵌入特征不平衡問題,雙視角嵌入技術則能從正負角度挖掘關鍵信息,保持特征平衡。
此次研究提出的多示例學習的自適應密度分布挖掘與雙視角嵌入算法(DPMIL),通過自適應密度分布示例選擇技術,構建負代表示例集合和正代表示例集合;運用雙視角嵌入技術,計算示例與代表示例距離,得到局部向量并拼接為全局視角嵌入向量,解決傳統算法在示例選擇和嵌入處理上的不足。
實驗先進行參數分析,確定鄰域半徑為1.5,再通過與 4 種前沿的 9 個 MIL 算法對比,DPMIL 在多個數據集上性能良好,驗證了其有效性和優越性。陳天霖還分享投稿歷程,從 2023 年 11 月構思到 2024 年 10 月成功錄用,歷經撰寫、投稿、修改、返修等階段。講座最后,師生圍繞 DPMIL 算法多方面應用深入討論,在熱烈掌聲中圓滿結束,為師生帶來學術啟發。
