团队四篇论文被CCF A类国际学术会议AAAI 2024论文录用。AAAI, 全称AAAI Conference on Artificial Intelligence, 该会议是国际人工智能领域顶级会议之一,本届会议录用率为23.75%。

1.论文介绍

论文题目:Every Node is Different: Dynamically Fusing Self-Supervised Tasks for Attributed Graph Clustering

作者:朱鹏飞,王倩(硕士研究生),王煜,李佳璐,胡清华

论文概述:属性图聚类是一种无监督的任务,它将节点划分为不同的簇。自监督学习在处理这一任务方面显示出了巨大的潜力,最近的一些研究同时学习多个自监督任务,进一步提高了性能。目前,不同的自监督任务为所有节点分配相同的权重集合。然而,论文中观察到一些相邻处于不同簇的节点对不同的自监督任务需要显著不同的权重。为了解决这个问题,该论文设计了一种新颖的图聚类方法,即动态融合自监督学习。该方法使用来自门控网络的不同权重来融合从不同的自监督任务中提取的特征,并且提出了一种包含伪标签和图结构的双层自监督策略以有效地学习门控网络。充分的实验结果也证明了论文所提出方法的有效性。

2.论文介绍

论文题目: Dynamic Sub-graph Distillation for Robust Semi-supervised Continual Learning

作者: 范妍(博士研究生), 王煜, 朱鹏飞, 胡清华

论文概述: 连续学习策略通常需要大量的标记样本,限制了其在实际场景中的应用。在该论文中,我们提出利用数据的结构稳定性实现半监督连续学习(SSCL),即模型持续地学习新的标记受限的数据。我们分析并证明了未标记数据的不可靠分布会导致连续学习的不稳定, 并且无标记数据的遗忘问题没有得到解决, 该问题严重影响了SSCL的学习性能。为解决这一问题,我们提出了一种动态子图蒸馏(Dynamic Sub-graph Distillation, DSGD)的半监督持续学习方法,通过利用语义和结构信息在无标记数据上实现更稳定的知识蒸馏。首先,我们形式化定义了通用结构蒸馏模型,并为持续学习过程设计了动态图的构造方法。接下来,我们提出结构化的蒸馏向量,并设计了一种动态的子图蒸馏算法,从而实现了端到端的训练,能够适应不同尺度的任务扩展。最后,我们在三个数据集 CIFAR10、CIFAR100 和 ImageNet-100 上以不同的监督比例进行了实验。实验结果证明了我们的方法对无标记数据分布偏差的鲁棒性,并且在目前最新技术的基础上实现了性能的显著提升。

3.论文介绍

论文题目:Bi-directional Adapter for Multimodal Tracking

作者:曹兵,郭俊良(硕士研究生),朱鹏飞,胡清华

论文概述:由于计算机视觉的快速发展,单模态(RGB)目标跟踪近年来取得了重大进展。考虑到单一成像传感器的局限性,引入多模态图像(RGB、红外等)来弥补这一缺陷,以实现复杂环境下全天候目标跟踪。然而,当主导模态在开放场景下动态变化时难以获取充分的多模态跟踪数据,现有技术大多无法动态提取多模态互补信息,导致跟踪性能不理想。为了解决这一问题,我们提出了一种基于通用双向adapter的多模态视觉提示跟踪模型,实现多模态相互交叉提示。我们的模型由一个通用的双向adapter和共享参数的特定于模态的transformer编码器分支组成。编码器使用冻结的预训练的基础模型权重分别提取每个模态的特征。我们开发了一种简单而有效的轻量级adapter,将特定于模态的信息从一种模态转移到另一种模态,以自适应的方式执行视觉特征提示融合。通过添加更少(0.32M)的可训练参数,我们的模型与全微调方法和基于提示学习的方法相比获得了更好的跟踪性能。

4.论文介绍

论文题目:Exploring Diverse Representations for Open Set Recognition

作者:王煜,穆郡贤(硕士研究生),朱鹏飞,胡清华

论文概述:开放集识别任务要求模型对属于已知类的样本进行分类,同时在测试过程中拒绝未知样本。目前,生成模型在该任务中的表现通常优于判别模型,但最近的研究表明,生成模型在复杂任务上计算上不可行或性能不稳定。在本文中,作者深入分析了该任务,并发现学习补充表示在理论上可以降低开放空间风险。在此基础上,提出了多专家多样化注意力融合模型。该判别式模型由多个学习不同表示的专家组成,这些专家通过注意多样性正则化模块来学习,以确保注意图是相互不同的。每个专家的预测进行自适应融合,并通过打分函数拒绝未知样本。标准和大规模开放集识别任务上的大量实验结果表明,该方法在AUROC上的性能优于现有的生成模型高达9.5%,且计算成本较低。该方法还可以无缝地融合到现有的分类模型中。