欧洲计算机视觉会议ECCV(European Conference on Computer Vision)于2024年9月29日-10月4日在意大利米兰召开。在本次大会上,信息科学与技术学院张帆教授团队论文《LTRL: Boosting Long-Tail Recognition via Reflective learning》入选为口头报告(Oral)。
本年度ECCV从全球8585篇有效投稿中接收了2395篇论文,并有188篇入选口头报告论文,入选率2.1%。该论文是我校首篇ECCV口头报告。
研究成果
图1: 方法框架图
在现实场景中,知识分布通常呈现长尾分布,而人类通过复习、总结和纠错等方法,能够在这种均衡的分布中更全面地掌握知识。受这一学习过程的启发,作者提出了一种新颖的学习范式,称为反思学习(Reflecting Learning),用于处理长尾识别问题。该方法整合了三个过程:在训练期间复习过去的预测结果、总结并利用学习到的类别间的特征关系、以及纠正不同学习方式中的梯度冲突。这些模块设计即插即用,可以与现有的长尾学习方法结合使用,并在多个流行的长尾视觉基准测试中达到了最新的性能表现。
结论与展望
本文提出的反思学习(Reflecting Learning)通过知识复习,知识总结以及知识纠正,有效应对了长尾分布问题,并能与现有方法轻松集成,实验结果在多个视觉基准测试中取得了领先性能,证明了其在长尾识别中的有效性。未来的研究可以进一步拓展其在其他复杂任务和领域中的应用,并优化核心过程,以在不同模型架构中发挥更大潜力。结合其他先进技术,反思学习有望带来更多突破性成果。
作者信息
该论文第一作者为信息学院21级博士生赵启浩,共同一作为信息学院18级本科毕业生戴雅伦,张帆教授、胡伟副教授指导,并与兰卡斯特大学刘俊教授合作完成,北京化工大学为第一完成单位。
通讯作者简介
张帆,北京化工大学信息学院/人工智能中心教授,校学位委员会委员,中国电子学会/IEEE高级会员。2010年加入北京化工大学工作至今,期间赴美国伊利诺伊大学香槟分校、德国德累斯顿工业大学访问学习,主要研究方向为遥感图像处理、人工智能等,主持国家自然科学基金等项目30余项,在ISPRS P&RS、IEEE TGRS、CVPR、ICCV等期刊会议发表学术论文100余篇,总引用5000余次。荣获北京市自然科学二等奖、北京化工大学青年教学名师奖。