人工智能学院常毅教授指导的2021级博士研究生程博同学的论文" Eliminating Negative Word Similarities for Measuring Document Distances: A Thoroughly Empirical Study on Word Mover’s Distance" 被中科院一区期刊Transactions on Neural Networks and Learning Systems(CCF B类期刊)接收。本篇论文与吉林大学计算机科学与技术学院李熙铭副教授合作完成。
文章简介:
第一作者:程博
论文题目:Eliminating Negative Word Similarities for Measuring Document Distances: A Thoroughly Empirical Study on Word Mover’s Distance
期刊名称:IEEE Transactions on Neural Networks and Learning Systems (TNNLS)
期刊类别:中科院一区,CCF B类
论文概述:文档距离测量是信息检索领域一个基础但重要的研究课题,它的准确性决定着许多文本检索应用的性能。本文深入研究了词移距离(WMD)及其放松版本在各种场景下的特点,聚焦消极的单词相似度问题:WMD家族利用了所有的单词相似度,然而,它们中的大多数是无意义的,对文档距离测量产生了负面影响。为了解决这个问题,文中提出了信息相似度过滤器,并在此基础上,提出了一个有效的优化算法,实现了对WMD的精确逼近。理论分析和实验结果表明,该方法更适用于较长的文档,并且能够提高文档距离测量的准确性和效率。