2019年5月26日-27日,以“理论驱动应用”为主题的“2019杭州数据科学前沿国际研讨会”在杭州金溪山庄顺利举行。会议由浙江大学数据科学研究中心主办,浙江互联网金融联合会、浙大国际商学院、浙大数据分析和管理国际研究中心协办,由浙江大学管理学院教授陈熹、数学学院教授张立新、苏中根、张荣茂、计算机学院教授尹建伟牵头的组织委员会执行。
加州大学伯克利分校 Michael I. Jordan教授出席并作报告,来自国内院校如清华大学、北京大学、浙江大学、武汉大学、国外院校如哈佛大学、耶鲁大学、宾夕法尼亚大学等高校的专家学者和阿里巴巴、滴滴出行等企业人士共200余人参会。本次研讨会开幕式由浙江大学管理学院陈熹教授主持,共安排一场大会报告,28场邀请报告,共同探讨复杂数据分析的最新进展、医疗保健中的数据科学、服务计算&大数据分析、机器学习理论与应用、金融计量经济学、统计学习的进展、人工智能的现实应用等主题。
一、开幕致辞
吴朝晖校长与参会嘉宾代表合影
5月26日上午,浙江大学校长、中国科学院院士、著名计算机领域专家吴朝晖教授应邀参加开幕式并致辞。开幕式前吴朝晖校长亲切会见了嘉宾代表,包括数据科学研究中心学术委员会主任、美国宾夕法尼亚大学沃顿商学院讲座教授、著名统计学专家蔡天文教授,美国加州大学伯克利分校杰出教授、人工智能领域的根目录任务、美国国家科学院、美国国家工程院、美国艺术与科学院三院院士Michael I. Jordan教授、威斯康辛大学王亚珍教授、浙江大学管理学院陈熹教授等。
吴朝晖校长开幕会致辞
开幕致辞中,吴朝晖校长代表浙江大学对前来参会的各界人士表示热烈欢迎,吴校长指出当前正是第四次工业革命和第二次机器革命向纵深推进的时代,人工智能也已经进入到了2.0时代,数据科学作为重要的驱动力在新一轮的技术、工业和教育革命中越来越重要。AI将会变得增加聪明和易于获取,物理空间与虚拟时空的交互将会越来越频繁,而数据科学将会带领我们见证更激动人心的时代和更加智慧的社会,这预示着人类和机器越来越不可分割。浙大为此实施了“创新2030计划”,包含四项专项研究计划内容:“双脑计划”“量子计划”“生态文明计划”和“设计育种计划”。 浙大聚焦未来创新蓝图,打造多学科参与的学术共同体以及科学、技术和产业的创新联合体,通过体系化、有组织的规划实施,将计划任务与国家战略目标、区域重大需求及学校“双一流”建设规划紧密结合起来。”“创新2030计划”不仅仅是为了学术研究,更是为了人才,它将破除学科之间的壁垒,促进多学科的共同发展。我们都见证、参与、努力并受益于数据科学的发展,而学科的发展需要基于知识的链接与学者的合作。希望学者们能在这次会议上有所收获,为未来数据科学的发展上做出新的贡献。
二、特邀嘉宾——加州大学伯克利分校 Michael I. Jordan教授分享报告
加州大学伯克利分校 Michael I. Jordan
美国加州大学伯克利分校的Michael Jordan教授以“基于梯度的优化:加速算法,随机化和非凸问题”为题目进行了一场精彩报告。Jordan教授从优化和采样两个视角的对照出发,对计算统计学进行思考,优化对应微分,采样对应积分。随着数据量越来越大,如何在得到最优解和计算开销上取得平衡,是一个很棘手的问题,并介绍了当前算法和理论的进展。“采样慢,优化快”是否真的如此?讲座大致分为7个部分:1. 怎样有效跳出驻点?提出了扰动梯度下降法PGD,在梯度小于阈值时,给x增加随机微扰,从几何学和动力学角度检视了驻点邻域。2. 给出了加速梯度下降的范式,将收敛速度从O(1/k)提高到O(1/k^2),并从连续时间视角,将梯度下降算法视为梯度流的离散化,而加速梯度下降法则可视为一个二阶ODE方程;然后进一步将以上变分过程泛化,建立了Bregman拉格朗日方程,求解出对应的欧拉朗格朗日公式,考察了Bregman哈密顿的辛积分。3. 介绍了如何在现有梯度求解基础上,实现加速算法。其理论基于哈密尔顿分析,对给定的节点施加一定的速度,并快速判断其是否是驻点。4. 介绍了随机过程下的梯度优化策略。首先他给出了在过阻尼和欠阻尼下的Langevin马尔可夫过程,建立随机微分方程,并开创性地提出反射耦合的证明理论。5. 简要介绍了在采样系统下的加速算法,给出了Nesterov下的加速算法,并利用流形概率估计得到其分布。6. 简要介绍了在实际采样过程中,由于实际采样得到的数据点往往是不平滑的,如何在非平滑数据下寻得最优解,并通过试验给出了其所能达到的误差下界。7. 最后给出了在市场条件下的梯度学习策略,并利用博弈论中的纳什均衡结论解决梯度问题。期间,Jordan教授还分享了其关于AI发展的看法,他认为下一阶段的AI,将会和市场和社交网络紧密结合,并最终改变我们的生活方式。他给出了关于AI的一个范式,即AI=Data+Algorithms+Markets。通过大量汇集的数据,提升学习算法,并向市场提供更优质的算法。
【附】 Michael I. Jordan教授的ppt详情请见官网“下载专区”
Michael I. Jordan报告现场(2)
三、交流与探讨
随后,28场邀请报告在四个分会场如期举行,受邀的国内外知名专家就复杂数据分析的最新进展、学习理论和压缩感知、生物数据分析统计方法的进展、转化生物医学数据科学、应用统计方法的最新发展、医疗保健中的数据科学、复杂数据分析的最新发展 等议题进行了深入交流与探讨。会议结束后,与会人员纷纷表示本次会议收获颇丰,专家学者们极具前瞻性、综合性的研讨,将为他们在自己领域进一步的研究、实践以及校企合作提供了思路与灵感。
作为中国数据科学领域的高端学术活动,2019杭州数据科学前沿国际研讨会聚集了大批专家与知名学者,跨学科、跨专业的学者分享研究成果、交流思想,为各学科的交流与融合打开新局面。 放眼未来,浙江大学数据科学研究中心将继续充分发挥各学科间的桥梁作用,致力于推动未来中国的数据科学发展。
参会人员合影
文字素材:徐仁军
编辑:牛茜