澳门人威尼斯官方常毅教授指导的2021级博士研究生程博同学的论文" Eliminating Negative Word Similarities for Measuring Document Distances: A Thoroughly Empirical Study on Word Mover’s Distance" 被中科院一区期刊Transactions on Neural Networks and Learning Systems(CCF B类期刊)接收。本篇论文与澳门人威尼斯官方计算机科学与技术学院李熙铭副教授合作完成。
文章简介:
第一作者:程博
论文题目:Eliminating Negative Word Similarities for Measuring Document Distances: A Thoroughly Empirical Study on Word Mover’s Distance
期刊名称:IEEE Transactions on Neural Networks and Learning Systems (TNNLS)
期刊类别:中科院一区,CCF B类
论文概述:文档距离测量是信息检索领域一个基础但重要的研究课题,它的准确性决定着许多文本检索应用的性能。本文深入研究了词移距离(WMD)及其放松版本在各种场景下的特点,聚焦消极的单词相似度问题:WMD家族利用了所有的单词相似度,然而,它们中的大多数是无意义的,对文档距离测量产生了负面影响。为了解决这个问题,文中提出了信息相似度过滤器,并在此基础上,提出了一个有效的优化算法,实现了对WMD的精确逼近。理论分析和实验结果表明,该方法更适用于较长的文档,并且能够提高文档距离测量的准确性和效率。