论文题目:Asymmetric Reinforcing against Multi-modal Representation Bias
作者:高西远(博士研究生),曹兵,朱鹏飞,王楠楠,胡清华
论文概述:多模态学习的优势在于它能够整合来自不同来源的信息,从而为学习任务提供丰富而全面的见解。然而,在现实世界中,多模态系统常常面临不同模态对决策贡献不均的问题。具体而言,不同模态的主导地位可能因环境条件的变化而发生转移,从而导致多模态学习的结果局限于次优解。现有方法主要关注增强弱势模态的学习,以平衡多模态学习中的偏差,但这种优化方式往往以牺牲优势模态的性能为代价。为了解决这一问题,我们提出了一种针对多模态表示偏差的不对称增强方法——ARMR。该方法动态强化弱势模态的学习,同时通过条件互信息维持优势模态的表征能力。具体而言,我们首先提供了一个理论分析,证明了优化部分模态可能会导致信息丢失,从而妨碍多模态学习的全面优势发挥。随后通过基于互信息的方式动态评估模态贡献,并逐步缩小模态间的贡献差距。大量实验结果表明,ARMR不仅显著提升了多模态学习的整体性能,还在缓解不平衡多模态学习方面取得了显著进展。
@article{cao2024visible, title={Visible and Clear: Finding Tiny Objects in Difference Map}, author={Cao, Bing and Yao, Haiyu and Zhu, Pengfei and Hu, Qinghua}, journal={arXiv preprint arXiv:2405.11276}, year={2024} }
<pre>
@ARTICLE{Gao22LUSS,
author={Gao, Shanghua and Li, Zhong-Yu and Yang, Ming-Hsuan and Cheng, Ming-Ming and Han, Junwei and Torr, Philip},
title={Large-scale Unsupervised Semantic Segmentation},
journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
year={2023},
volume={45},
number={6},
pages={7457-7476},
doi={10.1109/TPAMI.2022.3218275}
}
</pre>