新疆时时彩开奖号码-重庆时时彩万能投注

我院研究生在CIKM和EMNLP發表學術論文

文章作者:王欣 責任編輯:唐亮 審核人:彭博 文章來源:

近日,學院四川省油氣勘探開發智能化工程研究中心在知識檢索和自然語言處理領域的研究中取得新進展,分別在ACM International Conference on Information and Knowledge Management(CIKM 2024)和Conference on Empirical Methods in Natural Language Processing(EMNLP 2024)發表系列學術論文。

2022級碩士生付勛擔任第一作者,謝文波老師、王欣教授指導,碩士生陳斌、鄧濤、鄒甜共同參與的論文《ACDM: An Effective and Scalable Active Clustering with Pairwise Constraint》被CIKM 2024錄用。CIKM會議是信息檢索和數據挖掘領域的頂級國際會議,屬于CCF推薦的B類國際學術會議。2024年CIKM共收到1496篇有效投稿,最終錄用347篇,錄用率僅為23%。這是該團隊首次在該會議發表論文。代碼鏈接:https://github.com/briceloskie/ACDM。

論文提出了一種主動聚類擴散模型(ACDM)。ACDM利用最近鄰技術構建擴散圖,并通過在線框架迭代地改進聚類結果。在每次迭代中:(a) 以批處理方式選擇具有高不確定性和代表性的節點;(b) 使用基于鄰域集合的新型查詢,利用成對約束對所選節點進行分類;(c) 將已分類的節點作為擴散模型中的源節點,細化聚類。復雜性理論分析和實證評估均證明了該方法的有效性和可擴展性。值得注意的是,ACDM對數據相似度不敏感,適用范圍廣泛。該研究為主動聚類領域做出了重要貢獻,為大規模數據的管理提供了新的解決方案。

張望(2021級碩士生)、鄧濤(2023級碩士生)、吳曉茹(2023級碩士生)和王欣教授、王騫老師合作完成的論文 《From Text Segmentation to Enhanced Representation Learning: A Novel Approach to Multi-Label Classification for Long Texts》被自然語言處理國際會議EMNLP接收。該會議屬于CCF B推薦會議,在國際自然語言處理領域中享有較高聲譽。論文提出的LSKTC算法用于多標簽文本分類。在該任務中,每個樣本可以被分配多個類別標簽。現有大多數模型依賴于預訓練模型來提供高質量的文本表示。然而,當處理較長的文本時,由于預訓練模型對輸入長度的限制,這些模型會面臨挑戰。為了應對長文本分類的問題,論文引入了一個綜合性的解決方案,具體如下:1)文本分割算法:該算法旨在克服文本輸入長度限制的問題。算法能保證生成最優的文本分割結果,使得長文本可以被分割成更小的片段,然后再分別處理。2)外部知識和標簽共現:在表示學習過程中整合外部知識和標簽的共現信息,以增強文本和標簽的表示能力。這有助于捕捉文本和標簽之間復雜的關聯性,從而提升分類性能。3)有效性驗證:通過在多種MLTC數據集上進行廣泛的實驗,驗證了所提出方法的有效性。實驗結果也證實了論文的觀點:文本和標簽之間具有復雜的相關性。

論文的研究內容旨在改進長文本的多標簽分類性能,并通過利用文本內部結構和外部信息來增強模型的理解能力。這樣的研究不僅有助于解決實際應用中的長文本分類問題,也為進一步的研究提供了新的視角和技術手段。


更新時間:2024-09-20

Copyright? 2018 All Rights Reserved. 西南石油大學計算機與軟件學院

百家乐官网平注法口诀技巧| 钱隆百家乐官网大师| 尊龙娱乐网| 百家乐官网庄闲机率分析| 百家乐投注外挂| 乐宝百家乐娱乐城| 天镇县| 百家乐网上赌博网| 金海岸百家乐官网娱乐城| 金冠百家乐的玩法技巧和规则| 玩百家乐官网必赢的心法| 百家乐投注双赢技巧| 皇家金堡娱乐| 百家乐赌博策略论坛| 川宜百家乐官网注册号| 百家乐官网投注窍门| 大发888娱乐官方网站| 百家乐官网打揽法| 大发888娱乐场 ylc8| 百家乐官网自动下注| 大丰收娱乐城开户| 赌王百家乐的玩法技巧和规则 | 百家乐深圳广告| 七胜百家乐官网娱乐平台| 威尼斯娱乐| 百家乐国际娱乐网| 优博家百家乐官网娱乐城| 丰禾国际| 百家乐龙虎扑克| 大富翁娱乐城| 大发888娱乐场大发888娱乐场下载| 博坊百家乐游戏| 香港百家乐官网六合彩| 安福县| 立博百家乐官网的玩法技巧和规则 | 百利宫百家乐官网现金网| 全讯网论坛| 百家乐投注技巧球讯网| 巴特百家乐官网的玩法技巧和规则| 真人二八杠| 茅台百家乐官网的玩法技巧和规则|