学术讲座

首页 > 通知动态  > 学术讲座
2020年10月17日学术报告二则(崔斌 教授 北京大学;毛睿 教授 深圳大学)
2020年10月14日14时 人评论

报告题目1:分布式机器学习算法的系统优化

报告时间:20201017日(周六)下午14:00

报告地点:计算机学院B403会议室

报告人:崔斌

报告人单位:北京大学

报告人简介: 

崔斌北京大学计算机系副主任长江学者特聘教授,网络与信息系统研究所所长。研究方向包括数据库系统设计和性能优化、数据挖掘、大数据管理和分析等,在相关领域发表了100多篇学术论文。担任中国计算机学会数据库专委会副主任,VLDB理事会理事,IEEE TKDEVLDB Journal等期刊编委,以及数十个国际会议的程序委员会委员。他是中国计算机学会杰出会员,于2008年获得微软亚洲研究院的“微软青年教授奖”,2009年获得中国计算机学会 “CCF 青年科学家奖”,2014年获教育部自然科学二等奖。

报告摘要 

分布式机器学习算法已经被广泛地用于大规模数据分析与挖掘。在分布式机器学习系统中,我们需要考虑一些对系统性能有重要影响的因素,如并行策略、同步协议和网络通信等。报告将介绍我们在分布式机器学习系统设计优化的一些工作,包括面向高维海量数据的并行策略、面向异构环境的同步协议、基于数据草图的梯度压缩方法。报告最后也将介绍北京大学与腾讯合作研发的分布式机器学习系统Angel,系统针对海量训练数据和高维的模型参数做了深度优化,在易用性、稳定性、可扩展性等方面获得了良好的效果,并支持多种不同类型的机器学习算法。Angel系统作为腾讯第三代高性能机器学习计算平台,已经在腾讯的多个实际业务中得到了应用,并在GitHub开源 (https://github.com/Tencent/angel)

 

报告题目2大数据泛构: 应对多样性挑战

报告时间:20201017日(周六)下午15:00

报告地点:计算机学院B403会议室

报告人:毛睿

报告人单位:深圳大学

报告人简介: 

毛睿,博士,教授,博导,主要领域通用大数据管理;中国科学技术大学计算机学士和硕士、美国得克萨斯大学奥斯汀分校统计硕士和计算机博士、曾任甲骨文美国公司高级工程师;现任深圳大学计算机与软件学院副院长、深圳计算科学研究院执行院长、大数据系统计算技术国家工程实验室副主任;提出了面对多样性挑战的大数据泛构模式,建立了基于度量空间的通用大数据管理理论框架;2016军队科技进步二等奖(2);深圳市地方级领军人才。

报告摘要:

目前的大数据处理主要都围绕大数据的volumevelocity这两个挑战,对于variety挑战的研究相对较少。通用的数据处理技术因其广泛的适用性和相对低的开发成本,一直受到商业数据库管理系统的亲睐。大数据泛构(big data genhierarchy)把数据抽象成度量空间中的点,利用数据间距离的三角不等性进行数据的管理和挖掘等工作,具有高度的通用性。基于这一思想,我们开发了UMAD软件包,构建通用大数据管理挖掘框架。


邀请人:杜博 教授


版权所有 ©武汉大学计算机学院 | copyright © 2008-2020 School of Computer Science, Wuhan University. All Rights Reserved.