本网讯(通讯员 崔侃)近日,IEEE国际多媒体与博览会会议International Conference on Multimedia and Expo(CCF-B 类会议oral)ICME 2025前沿领域研究录用结果公布,金沙集团计算机与人工智能学院多模态视频理解团队的论文成功入选。
该论文题为《弥合一对多差异:基于多标签语义学习与中继的视频描述生成算法》“Bridging the One-to- Many Gap: Multi-label Semantic Learning and Relay for Video Captioning”,3354cc金沙集团是第一署名单位,由22级电子信息硕士研究生(3354cc金沙集团-湖北师范大学联合培养)胡一康完成,金沙集团计算机与人工智能学院杨莉教授、余良俊教授、陈淑琴博士及武汉理工大学钟忺教授联合指导。
这项研究成果在国际上首次将视频与其描述之间的一对多关系转换为一对一映射模式,创新性地提出了一种多标签语义学习与中继框架。该框架能够利用多个字幕的句子级和词级特征,捕获多层次粒度的语义互补性,并构建参数共享机制,从而解决视频字幕生成中的语义损失问题。实验结果显示,该成果超越了当前该领域的先进方法,具备更为优异的视频字幕生成性能。
据悉,IEEE ICME是计算机多媒体领域最重要且权威的两大国际旗舰会议之一,已连续举办26届。今年ICME在法国南特举办,论文投稿量达3737篇,录用文章1022篇,录用率为27.3%,其中oral类153篇。此次金沙集团团队的成果入选,充分彰显了学校在相关领域的科研实力与人才培养成效。(图片由通讯员提供 新闻中心编辑 夏锐)