澳门人威尼斯官方杨博老师和陈贺昌老师共同指导的2021级博士研究生黄思理的论文《Learning Generalizable Agents via Saliency-Guided Features Decorrelation》被CCF-A类会议NeurIPS 2023接收。
黄思理同学是强化学习项目组成员,一直从事深度强化学习、迁移学习相关的研究工作,本篇工作由陈贺昌、杨博、常毅老师共同指导,同事与美国里海大学(Lehigh University)的Lichao Sun老师和马里兰大学帕克分校(University of Maryland, College Park)的Yanchao Sun老师合作完成。
NeurIPS,全称神经信息处理系统大会(Conference and Workshop on Neural Information Processing Systems),该会议固定在每年的12月举行,由NIPS基金会主办。NeurIPS为人工智能领域全球最高级别的学术会议之一,是CCF-A类国际学术会议。
论文题目:Learning Generalizable Agents via Saliency-Guided Features Decorrelation
指导教师:陈贺昌、杨博、常毅
收录会议:NeurIPS 2023
会议类别:CCF-A
论文概述:
在基于视觉的强化学习(RL)中,智能体通常难以很好地泛化至未观察到的状态空间。这些状态的变化可能发生在任务无关的特征(如背景噪声)和任务相关的特征(如机器人配置)中。为了同时在这两种情况下实现泛化,智能体需要准确地理解变异特征对决策的影响,即在策略模型中建立变异特征与决策之间的真正关联。为此,我们提出了显著性引导特征去相关(SGFD),通过样本重加权来消除特征间的相关性。具体地,我们的方法包括两个核心技术:随机傅里叶函数和显著性映射图。SGFD利用随机傅里叶函数来估计高维图像中复杂的非线性相关性,同时设计显著性图来识别变异特征。在显著性图的指导下,我们使用样本重加权来消除变异特征与未变特征间的相关性。我们的实验结果表明,SGFD可以推广到广泛的测试环境中,并且在处理任务无关变量和任务相关变量方面明显优于最先进的方法。