关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

北理工团队在人工智能图像识别领域取得新进展

2023.10.21

原文地址:http://news.sciencenet.cn/htmlnews/2023/10/510686.shtm

6533794ae4b03b5da6d01c41.png

深度学习作为新一代人工智能的核心技术,依赖于大规模的标注数据自动学习知识。然而,现实世界中的数据面临着标注噪声和数据分布不平衡(长尾)等科学挑战,这些问题严重影响了训练模型的性能。近期,北京理工大学光电学院的许廷发教授科研团队在长尾数据下的理论模型研究方面取得了突破性进展。相关研究成果以“Dynamic Loss For Robust Learning”为题,发表在国际顶级期刊《IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI)》上。IEEE TPAMI是人工智能、模式识别、图像处理等领域的顶级权威期刊,其影响因子高达23.6,同时也是中国计算机协会 (CCF) 推荐的人工智能领域A类期刊。

论文第一作者为北京理工大学江慎旺博士后和李佳男副研究员,通讯作者是北京理工大学许廷发教授。

针对智能图像识别任务的噪声和长尾数据训练模型不理想难题,许廷发科研团队首次提出和构建了元学习自适应鲁棒的数理模型。模型主要通过引入全新的动态损失函数,主动感知数据分布和训练状态,自适应地动态修正数据标注噪声以及调整识别的类间距离,实现了在长尾噪声数据下的鲁棒学习。

65337956e4b03b5da6d01c43.png

图1 元学习自适应鲁棒的数理模型

图2展示了分类间隔和特征分布随训练时间的变化图。随着训练过程的推进,间隔生成器主动学习分类难度,自适应增大长尾类别的间隔系数,如图2类别10(折线图标红部分)。模型生成了清晰的类别边界,如图2中的特征分布变化图,显著提升了模型应对长尾噪声数据的鲁棒性。

65337965e4b03b5da6d01c45.png

图2 分类间隔(上)和特征分布(下)随训练时间的变化图

论文提出的数理模型对元学习在图像识别领域的应用提供理论基础,其实验结果对实际环境的智能图像识别具有重要意义。

论文详情:S. Jiang, J. Li, J. Zhang, Y. Wang and T. Xu, "Dynamic Loss For Robust Learning," in IEEE Transactions on Pattern Analysis and Machine Intelligence, doi: 10.1109/TPAMI.2023.3311636.

论文链接:

附作者简介:

江慎旺,北京理工大学光电学院博士后。2014年、2020年分别获得北京理工大学学士、博士学位,研究方向为机器学习和计算机视觉。在国际顶级会议AAAI、IEEE等期刊发表学术论文16篇,谷歌学术总引用量98次,第一作者4篇,申请中国发明专利1项。曾获得2021年ICCV第二届反无人机国际挑战赛(The 2nd Anti-UAV Workshop & Challenge)冠军及该Workshop的最佳论文,大学生数学竞赛二等奖(北京市)、大学生物理竞赛二等奖(北京市)等荣誉。

李佳男,博士,北京理工大学光电学院预聘助理教授(特别副研究员),新加坡国立大学博士后。主要从事光电成像目标探测与识别等方面的研究,主持国家自然科学基金等项目5项。以第一/通讯作者在IEEE TPAMI、CVPR等顶级期刊或会议上发表学术论文60余篇,ESI高被引论文1篇,谷歌学术总引近4000次。入选中国科协及北京市科协“青年人才托举工程”项目,获得中国图象图形学学会优秀博士学位论文,王大珩光学奖等荣誉。指导学生获得ICCV 2021“反无人机跟踪”挑战赛国际冠军及最佳论文奖、中国高等教育博览会“校企合作双百计划”典型案例等。研究成果在“中国天眼”等国家重大科技基础设施中得到重要应用。

推荐
关闭