7月14日,IEEE/CVF International Conference on Computer Vision(ICCV 2023)公布录取结果,我院张帆教授课题组一篇论文入选。该论文为长尾图像识别方向做出了创新贡献。
论文信息:Qihao Zhao, Chen Jian, Wei Hu, Fan Zhang, Jun Liu: “MDCS: More Diverse Experts with Consistency Self-distillation for Long-tailed Recognition (IEEE/CVF International Conference on Computer Vision, 2023) ”
近年来,多专家方法显著提高了长尾图像识别的能力。我们总结了两个需要进一步提升的方面,以促进长尾识别效果:(1) 更多样化的专家;(2)更低的模型方差。然而,以前的方法并不能很好地处理这些问题。为此,我们提出了:具有一致性自蒸馏的多样化专家方法: MDCS,以弥补早期方法的不足。我们提出的MDCS由两个核心部分组成:多样性学习损失(Diversity Loss)和一致性自蒸馏(Consistency Self-distillation)。具体而言,多样性学习损失通过控制不同专家对不同类别的关注来促进每个专家识别的多样性。为了减少模型方差,我们采用KL散度来提炼弱增强实例中的知识,用于专家的一致性自我蒸馏。在消融分析中,我们证明了与之前的工作相比,MDCS可以有效地增加专家的多样性并且显著降低模型的方差,从而提高识别准确率。实验表明,MDCS在五个流行的长尾识别基准(CIFAR10-LT、CIFAR100-LT、ImageNet-LT、Places-LT和iNaturalist 2018)上的表现优于最先进水平。开源代码地址: https://github.com/fistyee/MDCS
国际计算机视觉大会(ICCV,International Conference on Computer Vision)由IEEE主办,每两年举办一届,是计算机领域世界顶级的学术会议之一,被中国计算机学会评为最高级别的学术会议(CCF A)。ICCV在2023年Google Scholar公布的学术期刊会议影响力排名中,位列所有学科期刊/会议中第17名。
该论文第一作者为信息学院博士生赵启浩,第二作者为大四毕业生姜晨,张帆教授、胡伟副教授指导,并与新加坡科技设计大学合作完成,北京化工大学为第一完成单位。该工作得到了国家自然科学基金等项目的资助。