论文题目:Asymmetric Reinforcing against Multi-modal Representation Bias

作者:高西远(博士研究生),曹兵,朱鹏飞,王楠楠,胡清华

论文概述:多模态学习的优势在于它能够整合来自不同来源的信息,从而为学习任务提供丰富而全面的见解。然而,在现实世界中,多模态系统常常面临不同模态对决策贡献不均的问题。具体而言,不同模态的主导地位可能因环境条件的变化而发生转移,从而导致多模态学习的结果局限于次优解。现有方法主要关注增强弱势模态的学习,以平衡多模态学习中的偏差,但这种优化方式往往以牺牲优势模态的性能为代价。为了解决这一问题,我们提出了一种针对多模态表示偏差的不对称增强方法——ARMR。该方法动态强化弱势模态的学习,同时通过条件互信息维持优势模态的表征能力。具体而言,我们首先提供了一个理论分析,证明了优化部分模态可能会导致信息丢失,从而妨碍多模态学习的全面优势发挥。随后通过基于互信息的方式动态评估模态贡献,并逐步缩小模态间的贡献差距。大量实验结果表明,ARMR不仅显著提升了多模态学习的整体性能,还在缓解不平衡多模态学习方面取得了显著进展。