常毅教授指导的澳门人威尼斯官方2019级硕士研究生王博同学的论文" Eliminating Sentiment Bias for Aspect-Level Sentiment Classification with Unsupervised Opinion Extraction "被国际会议EMNLP 2021(清华推荐A类,CCF B类)接收。
王博于2019年保送到我院攻读硕士,从研究生一年级起开始接受常毅老师与悉尼科技大学的联合指导,从事自然语言处理领域的研究工作。本工作与悉尼科技大学的Guodong Long教授、Tao Shen博士合作完成。
会议简介:EMNLP(Conference on Empirical Methods in Natural Language Processing)是计算语言学和自然语言处理领域的顶级国际会议,由ACL SIGDAT(语言学数据特殊兴趣小组)主办,每年举办一次,Google Scholar计算语言学刊物指标中排名第二。EMNLP 2021将于2021年11月07日至11日在多米尼加共和国蓬塔卡纳及在线会议的形式同时举办。
第一作者:王博
论文题目:Eliminating Sentiment Bias for Aspect-Level Sentiment Classification with Unsupervised Opinion Extraction
会议名称:The 2021 Conference on Empirical Methods in Natural Language Processing
会议类别:清华推荐A类,CCF B类会议
会议时间:7th–11th November 2021, Punta Cana, Dominican Republic.
论文概述:方面级情感分类(ALSC)旨在识别句子中特定方面词的情感极性。ALSC是方面级情感分析中一个最实际的设定,因为它不需要昂贵的意见词标注信息,但同时它也丧失了对于情感分类结果的可解释性。为了解决这个问题,最近的工作通过微调预训练Transformer编码器来抽取以方面词为中心的依存树来定位意见词。然而,这样推导出来的意见词只能提供一种直观的线索,远远无法达到人类级别的可解释性。除此之外,预训练编码器倾向于内化方面词的内在属性,会造成情感偏见问题,从而影响模型的性能。
在本文中,我们提出了一种span-based反情感偏见的方面词表示学习框架(SARL)。首先,它首先利用方面词的先验情感进行对抗学习来消除方面词嵌入表示中的情感偏见。随后,它通过span-based依赖关系建模来将意见词和与其对应的经过蒸馏学习得到的候选意见词进行对齐,实现了无监督意见词抽取,并为ALSC提供可解释性。本文中提出的方法在5个数据集上实现了领先的性能,且具备无监督意见词抽取的能力,能够有效的解决方面级情感分类问题,并为分类结果提供可解释性。