国家多媒体软件工程技术研究中心
类别:未知 发布人:admin 浏览次数: 发布时间:2015-10-19 11:38

一、基本情况:

国家多媒体软件工程技术研究中心(以下简称中心)组建于1996年,是国内首家国家级多媒体领域的工程中心。中心现有教授6人,副教授6人,讲师及助教15人,相关领域的博士研究生34人,硕士研究生103人。2007年以来,共承担国家级项目25项。其中,主持4项国家重大项目、15项国家自科基金项目;省部级项目25项,其中省部级重点项目8项;企业委托56项,自主科研项目11项,国际合作1项。获教育部科技进步二等奖、湖北省科技进步二等奖、湖北省科技成果推广二等奖等3项。出版学术著作10余篇,发表论文200余篇,授权的国家发明专利115项。

二、主要研究方向:

中心研究方向包含数字音频共性技术、多媒体信息系统技术和多媒体数字安防技术。
在数字音频共性技术领域,聚焦在信源编码技术为主的多媒体信息处理技术上,开展三维音频编码研发、立体视频编码研发、移动音视频编码研发、AVS国家标准制定。
在多媒体信息系统技术领域,研究内容包括信息的获取与表示、多媒体数据的存储与管理,以及信息分类和个性化服务等;联合制订数字内容管理国际标准,开展七层数据存储模型研发,代表中国国家成员体提出的数据管理参考模型成为标准技术框架核心内容;海量数据分发技术研发;医疗、交通大数据架构和计算算法研发。
在多媒体数字安防技术领域,以刑侦图像分析技术为代表的行业深度应用研究,开展城市安防系统架构研究、刑侦图像处理和检索研发、安防风险预测研发、安防国家、行业标准制订

三、主要研究团队:

胡瑞敏教授、博导,现任武汉大学计算机学院院长、国家多媒体软件工程技术研究中心主任。国家电子文档总体专家组成员、公安部十二五科技支撑计划专家组成员、中国通信学会智慧城市专家组成员、中国计算机学会多媒体技术与应用专业委员会委员、国家数字视音频编解码技术专家组成员、国家数字视音频编解码技术专家组成员。主要研究方向:多媒体网络通信、安防应急信息处理和多媒体应用系统等。曾经获第五届中国青年科技奖、第七届中国青年科技创新奖、湖北省十大杰出青年奖。
陈军教授、博导,现任国家多媒体软件工程技术研究中心副主任。主要研究方向是:多媒体网络通信、安防应急信息处理和多媒体应用系统等。主持开发的城市安全多级联网视频监控系统平台,在国内网络存储规模最大的东莞公安视频监控项目、国内首个基于移动和固网混合异构网络的大规模视频监控工程——深圳公交监控项目等国内多个重大示范工程中使用
陈丹教授、博导,教育部新世纪优秀人才支持计划入选者(2011)、楚天学者特聘教授(2010)、湖北省新世纪高层次人才(第二梯队,2012)。主要研究方向为复杂科学数据处理;复杂系统建模与仿真。担任IEEETCSCTechnicalAreainGreenComputing的指导委员会委员、英国华威大学科学计算中心AssociateFellow;多个IEEE/ACM国际学术会议的主席与程序委员会成员、IEEE/ACM会员、中国生物医学工程学会高级会员、多个国际期刊编委(如ScalableComputing(Springer),ParallelandDistributedComputingandNetworks(ACTA))。近年来于美国CRC出版社出版2部专著;发表SCI与EI检索计算机类学术论文90余篇;其中SCI期刊论文40余篇,获得5次国际会议最佳论文奖和杰出论文奖。

四、承担的重大项目:

1.   维音频基础理论与关键技术

基于NHK22.2精简3D音频系统,研究并建立基于感知的3D音频空间声场感知、空间距离信息的计算、高效参数编码、扬声器系统优化、声场重建与评价的理论技术体系,提高信号压缩效率和重建质量,助力全3D的视听产业发展。
理论创新主要包括:首次在全空间方位上获取了空间参数JND随声源位置和频率变化的数据,建立了三维空间方位感知模型。(2)提出多信息联合的子带重要性测度准则、面向多音源的极坐标变换编码方法、提出包含距离参数的三维音频编码框架。(3)提出利用重点区域声压差代替中心点声压差作为失真测度,提出基于非球面扬声器组的EVBAP模型,首次实现了多声道三维音频系统的自动精简和信号重分配。(4)首次在空间摆放可配置的精简三维音频系统上实现了距离感知的恢复。
取得的成果:在国际期刊和国际会议上已发表学术论文31篇,其中SCI收录7篇,EI收录18篇。申请国家发明专利31项,其中授权12项,分别在空间距离表达研究、扬声器组精简研究、空间参数编码研究等方面位居国内同行之首。搭建了我国首个针对MPEG需求的多声道三维音频精简重建系统,组织成立深圳市3D多媒体信息与数据分析处理重点实验室。

2.   AVS音频标准技术研究

为提升国内自主知识产权标准的技术水平,AVS发布了“下一代AVS音频编码框架方案征集书”以征集下一代音频编码框架。根据AVSN1854的要求,中心提出了面向下一代语音音频应用的AVS编解码框架。通过各模块的有效处理,实现语音、音频编解码,满足对复杂声音信号实时处理的实际需求。为准确评估移动音频质量,工程中心提出了一种针对AVS-P10编码器的客观质量评价方法,与传统的PEAQ方法相比较,主客观得分拟合的相关度更高。
取得的成果:AVSP10于2013年12月31日正式颁布为国家标准,并于2014年7月正式实施。为推动AVS-P10标准的应用,中心开展了基于多平台的AVS-P10应用系统开发工作,对AVS-P10参考代码进行优化和封装,开发基于AVS-P10的移动音频应用系统,建立AVS-P10音频流媒体点播系统。

3.   视频转码

针对城市监控视频数据规模剧增,着重研究面向非重叠覆盖下的城市监控摄像头产生的视频数据的高效联合编码的核心技术,涵盖了移动视频压缩,监控场景下的全局视频压缩及视频转码,搭建面向跨时空的多源城市监控数据的高效编码框架,完成面向多编码模式的容错性转码、实时性转码关键技术研究及仿真验证;完成容错性转码的率失真优化算法和实时性转码的模式选择算法等模块的开发。
理论创新主要包括:(1)提出基于对象知识的高层表达方法。并基于此分析多源监控视频中的全局对象冗余分布规律及时空演化规律。为城市多源监控视频联合编码提供基础指导;(2)提出基于姿态参数的预测方法。(3)提出并实现了基于对象知识表达和预测的监控视频编码框架。通过分别考虑前景的运动特征和背景的长时稳定特征,在压缩效率上有的很大的提高。(4)提出并实现了基于视觉关注度的可伸缩视频编码算法和实时视频转码算法,增强了大容量视频转码分发系统的负载和设备融合能力。(5)提出了并行转码框架下实时性转码帧内模式选择算法,结合转码前图像块系数的能量分布特征,预测最优的编码模式候选集,降低模式选择复杂度,提高转码速度;(6)提出了并行转码框架下容错性转码模式刷新算法,分析了并行转码框架对帧间编码模式运动矢量范围的限制以及对时域误差扩散的影响,通过估计并比较宏块在帧间和帧内编码模式下的率失真代价,提高容错效果。
取得的成果:本项研究发表学术论文7篇,申请专利1项,受理1项。

4.   行人重识别关键技术研究

针对特定嫌疑目标(尤其是人)的监控视频检索已成为刑事侦查工作中亟待解决的重要课题,实际应用中不同摄像头下行人外貌差异较大,代表图提取丢弃了大量图像帧,造成匹配不准确。本课题提出一整套基于模型表示的行人重识别方法:对行人对象的图像序列进行建模,获得基于序列对象表观模型的行人外貌表示;采用协同训练的方法,利用未标注样本提升基于模型表示的距离学习的性能,减少对标注样本的依赖;将双向验证的思想引入到基于模型表示的行人重识别方法中,自动重排初始结果。解决和改进行人重识别技术中行人视觉特征表示能力不强,视觉特征不同环境下差异巨大,没有可用选择反馈样本等三大难题。
理论创新主要包括:(1)提出行人重识别新的解决框架,先将文本描述转换为一个属性向量,然后通过稀疏重构对属性向量进行自动补全,并且引入属性向量的尺度学习对补全后的向量进行检索,成功的解决这一难题。论文在多媒体检索国际会议ICMR2015上发表。(2)提出基于特征投影的行人重识别技术,通过将不同摄像机下行人特征向量投影到独立的行人特征空间,克服多摄像机下行人特征表达差异的影响,进一步提高识别准确率。论文在多媒体顶级国际会议ICME2013被推荐为口头汇报,并在CCFB类期刊TCSVT上发表。(3)提出并实现了基于局部负反馈的行人重识别排序优化方法,可明显提升识别准确率。论文在泛太平洋多媒体国际会议PCM2014获得最佳论文奖。
取得的成果:发表学术论文11篇,申请专利6项,位居国内同行之首。本项研究思路在全国研究智慧城市大赛获创意类特等奖,受到关注与好评。研究成果已形成产品,已在全国各地公安机关得到成功应用。开发了面向视频侦查的行人重识别核心算法和相关设备,实现了面向公安视频侦查行业的业务应用系统。

5.   基于云计算的智慧城市大数据处理及服务关键技术研发

研究智慧城市大数据处理与服务中涉及的视频转码、图像增强、人脸超分辨率增强、视频浓缩、视频检索、语义标注和知识推理、云存储等关键技术,开发基于云计算的视频侦查业务平台,实现在一个大城市的示范应用。
在公安行业,中心主持了湖北省重大科技创新计划“基于云计算的智慧城市大数据处理及服务关键技术研发”、湖北省自然科学基金面上项目“面向大范围动态场景的嫌疑目标轨迹排查关键技术研究”等项目。项目成果有力提升了我国城市安全监控大数据的价值和利用效率,在此基础上提高了我国城市安全监控系统的数据分析能力。
在医疗大数据行业,整合物联网行业的穿戴式移动数据采集、移动互联网行业的智能手机医疗健康服务、医疗行业的医疗数据资源分析服务、大数据服务行业的医疗数据管理、挖掘和分析,强化健康风险预测分析机制和疾病预防医学分析机制相结合的大数据分析服务模式。发展从多源异构医疗数据中提取元数据的方法,形成可归类的医疗健康数据单元集合,构建医疗健康大数据形式化表达的方法。发展深度关联分析方法,理解个体在时间维度上的健康演化特性。研究如何理解多个因素的综合作用,为个性化治疗以及慢性非传染性疾病管理提供依据。发展支持理解个体差异与疾病发生和诊疗关联机制的方法。发展有效的计算方法与平台应对此过程中大数据准备、数据仓库建立与数据挖掘量大及复杂度高带来计算方法上的挑战,支持大数据驱动下的预防医学发展。

五、取得的主要成果:

获奖
中心获教育部科技进步二等奖、湖北省科技进步二等奖、湖北省科技成果推广二等奖等3项。
由中心硕士生组成的队伍在全国研究生电子设计大赛、数学建模竞赛都取得了优异的成绩。参加的全国赛事包含全国研究生电子设计大赛、全国研究生数学建模竞赛、全国研究生智慧城市技术与创意设计大赛。2014年8月,由工程中心博士生、硕士生组成的三支队伍均进入全国研究生智慧城市技术与创意设计大赛决赛,获得特等奖1项、三等奖1项和优秀奖2项。
 

论文
中心在IEEETrans.、DCC、ACMMM等学术期刊会议上发表论文200余篇,截至去年底,CCFA类论文2篇,CCFB类论文18篇,CCFC类论文30篇,论文获得获ICME优秀奖(唯一中国获奖者),被MP3发明单位和Dolby实验室等国际同行引用,多名发表优秀论文的同学应邀到多个国家做大会报告。
在泛太平洋多媒体会议(PCM,Pacific-RimConferenceonMultimedia,CCFC类会议)上,中心博士研究生王正、胡瑞敏教授和梁超博士提交的论文“Region-basedInteractiveRankingOptimizationforPersonRe-identification”,经过论文评审和现场报告环节的激烈角逐,获得本次PCM大会唯一的最佳论文奖。评审专家委员会一致认为“Themethodisverysimpleandfast,andcanbeappliedintherealworldtosolvetheimportantproblemeffectively.”。

 
专利与标准
中心目前已制订ISO国际标准1项、国家标准4项、行业标准8项,参与制订国家标准2项、行业标准3项。主持制订的AVS-P10作为我国首个移动音频编码标准已于2013年正式颁布,拥有自主知识产权。工信部测试表明达国际先进水平。制订IEEE首个多媒体信源编码国际标准(IEEESAP1857)。
申请国家发明专利189项,授权115项。其中图像超分辨率领域专利数量全国第一;视频转码领域专利数量全国第一;空间音频领域专利数量全国第一;三维音频领域专利数量全国第一。
 
 
附:国家多媒体软件工程技术研究中心人员名单
主任:胡瑞敏
副主任:彭敏、陈军
教授(研究员):陈  军   陈  丹   胡瑞敏   王中元
副教授(副研究员):高  戈   怀  念   李  明   杨玉红   涂卫平   张晋东   朱  荣
其  它:陈  磊   陈强国   傅佑铭   韩  镇   何  政   胡志雄   梁  超   卜  浩
        邱凌燕   谭晓琼   王晓晨   肖  晶   叶  刚
上一篇:空天信息安全与可信计算教育部重点实验室(B类)
下一篇:没有了