2020年6月30日下午,南开大学统计与数据科学学院王兆军教授应邀为我校师生带来了一场以“如何用数据说话”为主题的线上讲座。王兆军教授的研究领域包括工业工程中统计监控与诊断、复杂数据中的变点、异常点检测、实验设计、高维数据统计推断等,在Journal of the American Statistical Association、Annals of Statistics、Statistica Sinica等国际顶尖及一流统计学期刊上发表数十篇专业学术论文。同时,王兆军教授担任数职,是南开大学统计与数据科学学院执行院长、国务院学位委员会统计学科评议组成员、国家统计专家咨询委员会委员、中国现场统计研究会副理事长、中国工业统计教学研究会副会长、天津工业与应用数学学会理事长、《数理统计与管理》副主编、《数学进展》和《统计信息论坛》编委。本次讲座由厦门大学王亚南经济研究院方颖教授主持。

讲座开始,王兆军教授提出“统计数据会说谎”,引起同学们的兴趣,他告诉大家如何用数据也有讲究。王兆军教授用古今中外的名人名言介绍了统计的重要:春秋时期齐国政治家管子的文章中表明统计对国家的作用,华为创始人任正非在接受央视节目访谈时提到大数据时代离不开统计,马寅初先生和著名统计学家C.R.Rao的语录强调了统计的重要性。据相关数据,2017-2019年职位需求情况中,统计与数据科学家位列前五

王兆军教授通过女士品茶实验、孟德尔豌豆实验两个统计实验告诉大家在大数据时代,小数据同样重要,大数据中有小数据,小数据中也有大数据。他从红楼梦作者之谜中运用到的统计分析、赌球中运用到的概率知识、坦克产量中运用到的矩估计、身高问题中运用到的回归分析以及此次疫情期间得到了很好运用的玫瑰图,告诉大家“大数据时代,数据分析与处理是核心”。另外,王兆军教授从死刑数据中运用的数据分析、锻炼是否有利于健康的分析、婚姻状况与死亡率分析及“二八理论”出发,告诉大家数据分析没有最好,只有更好,而且数据科学正从以数据为中心的范式向以科学为中心的范式偏移。接着,王兆军教授用物体重量的测量实验设计、敏感问题调查、机场防爆检测、北京新冠核酸检测采用的混检、群组检验表明:大数据时代,数据采集与抽样依然有用。

什么是统计学?王兆军教授在抛出这个问题后首先阐述了陈希孺院士“数理统计学是一门用有效的方法收集和分析带有随机影响的数据学科”的观点,王教授认为“统计是研究数据的学问”,符号、文本、图像、声音都是数据。统计与数学在出发点、研究方法、评价方法上的区别是很大的,这也是统计从经济、数学独立出来的原因。随后,王教授还提到了大数据与人工智能,托马斯·萨金特曾表示“人工智能其实就是统计学,只不过运用了一个更华丽的词藻”,王教授认为更进一步地,人工智能是统计+计算机,它们的实现是一个复杂的问题,但不可否认统计的重要性。

随后,王兆军教授还向大家介绍了南开大学与南开统计的悠久历史。

最后,方颖教授对本次讲座进行了总结:讲座生动有趣,王教授向大家介绍了许多深刻的统计学思想,了解统计数据会说谎以及正确使用统计方法与数据分析对于刚刚接触统计的新生是非常好的教育。经典统计学思想和方法在大数据时代非但没有减弱而且是在加深。

讲座中,王教授用丰富的案例介绍了统计数据在生活中的应用,介绍了什么是统计学以及统计与数学的区别等内容。王教授幽默风趣的语言以及对统计科学的热爱给在线的每一位师生留下了深刻的印象。

 

WISE 2019级硕 秦叶


来源:厦门大学