武汉大学计算机学院在国际权威多媒体分析检索大赛中取得八项第一-武汉大学计算机学院

学院新闻

武汉大学计算机学院在国际权威多媒体分析检索大赛中取得八项第一

发布时间:2015-11-09     浏览量:

在刚刚结束的国际视频分析与检索技术评测TRECVID2015中,由武汉大学计算机学院院长胡瑞敏教授所领衔的国家多媒体软件工程技术研究中心(NERCMS)团队在实例检索任务(Instance Search Task)中取得佳绩,在30个官方规定的检索目标中有8个目标的检索准确率位居世界第一,整体总分位列INS项目全球第四名,超过日本NTT、澳大利亚昆士兰大学(UQ)、德国康姆尼斯工业大学(TUC)等世界知名研究机构。

由武汉大学计算机学院五名研究生(王正,叶茫,姚磊,刘俊,黄冰月)和两名本科生(柳东静,刘涛)组成的NERCMS团队,在胡瑞敏教授、陈军教授和梁超老师指导下,作为武汉大学唯一代表团队参加比赛。团队根据TRECVID2015中的实例检索任务(INstance Search task, INS),要求从海量视频数据(TB级)中检索出给定的30个包括人、车、物等(见图1)的特定目标(topic)。在面临检索目标大小不一,种类繁多,背景干扰大,对检索算法的性能和效果极具考验的情况下,团队基于经典的图像检索框架,提出了检索目标自适应的相似性度量方法,配合多源跨模态信息,如文本、人脸和车辆等,来综合得到初始的检索结果。在此基础上,团队进一步利用视频连续帧之间存在的时序关联特性,通过对相邻视频镜头的查询扩展来进一步优化初始检索结果,提高了算法准确率。

这是该团队第三次参加此项比赛,本次比赛进步明显,今年在INS任务上的检索准确率为0.367,较之2013年第一次参赛时的0.0063,成绩整整提高了58倍,使武汉大学在较短的时间内就成功跻身日本国立情报学研究所(NII)、香港城大(CityU)等视频检索领域世界一流的科研梯队。

据悉,面向视频检索的国际性评测TRECVID是由美国国家标准技术研究所(NIST)于2001年开始组织实施的,至今已经连续举办15届。历年的TRECVID评测都会向参评的世界知名高校和科研院所发布标准测试数据,参评者用这些标准测试数据测试自己设计的算法,并在规定时间内向组委会提交自己算法的运行结果,然后由美国国家标准技术研究所对提交结果进行评价和比较。今年TRECVID2015比赛共吸引了来自世界各地共69支队伍报名参赛,包括国内的一些知名科研院校以及一些世界著名科研机构(如卡内基梅隆大学、IBM研究院等)。

本次竞赛的相关技术已经运用在面向监控视频的特定目标检索中,并多次在实际案例中发挥了重大作用,极大地提高了视频监控中针对特定嫌疑目标的排查效率,对维护人民生命财产安全具有重大的意义。

图1:部分检索目标示例和算法结果。四个检索目标分别是“这盏灯”、“调味盒”、“这只狗”、“这辆车”。红色方框表示查询目标,绿色方框表示检索到的目标位置。