2019年2月28日下午,应广州大学经济与统计学院和岭南统计科学研究中心的邀请,在行政东前座412会议室,华东师范大学周勇教授、哥伦比亚大学袁明教授及香港理工大学黄坚教授分别作了“大数据统计学习理论与推断方法”、“SPARSE GRID MEETS RANDOM HASHING: LEARNING HIGH DIMENSIONAL FUNCTIONS OF FEW VARIABLES”和“A Statistical Perspective on Generative Learning”的学术报告——暨“羊城讲坛”第五十二讲,旨在进一步提高年轻学者及研究生对相关研究的理解。此次讲座由孙六权教授主持,相关专业的师生参加了此次讲座。
周勇教授是国家杰出青年基金获得者,教育部特聘教授,中国科学院百人计划入选者,国务院政府特殊津贴专家,“新世纪百千万人才工程”国家级人选。周勇教授主要从事大数据分析与建模、金融计量、风险管理、计量经济学、统计理论和方法等科学研究工作,取得许多有重要学术价值和影响的研究成果。先后承担并完成国家自然科学基金项目,国家杰出青年基金,自然科学基金委重点项目等科学项目10余项,曾获得省部级奖励二项。在包括国际顶级统计学和经济计量学杂志《The Annals of Statistics》、《Journal of The American Statistical Association》,《Biometrika》,《Journal of Econometrics》和《Journal of Business & Economic Statistics》等上发表学术论文近200篇。
报告主要内容:面对大数据应用的快速发展、国家经济和金融安全所提出的迫切需求,我们面临着大数据分析方法瓶颈与挑战,需要发展大数据基础分析的理论方法和技术,在此文中,我们介绍一些可以用来处理大数据的常用统计方法,介绍大数据下的高维和超高维数据降维技术和算法,并提出重要一些新的理论和方法,在无模型下介绍我们最新研究的一些重要处理大数据的技术与方法。同时,在超大数据集处理中,介绍divide-conquer方法(分块征服法),并给出相关最新研究和我们最近的研究,最后,讨论几种非超标准的处理大数据的方法,考虑来自不同相关研究数据,并通过组合方法给出一种基于经典统计方法来研究大数据的方法。最后,我们考虑在金融数据分析中,如何利用所提出的大数据处理方法来研究风险管理中的违约等常见现象,并进行一些有益的尝试。
袁明教授是哥伦比亚大学统计学教授。他曾是Morgridge研究所的高级研究员和威斯康星大学麦迪逊分校的教授。他的研究兴趣广泛存在于统计学以及统计学与其他定量和计算领域的接口,如优化,机器学习和计算生物学。特别地,他最近的研究重点是高维数据分析的算法和理论及其应用。他是The Annals of Statistics的合作编辑,并曾在众多其他期刊的编辑委员会任职。他是the John van Ryzin Award (2004; ENAR), a CAREER Award (2009; NSF), the Guy Medal in Bronze (RSS; 2014), a Leo Breiman Junior Researcher Award (ASA Section on SLDM; 2017), 和 a Medallion Lecturer等奖项的获得者。
报告主要内容:We investigate the optimal sample complexity of recovering a general high dimensional smooth and sparse function based on point queries. Our result provides a precise characterization of the potential loss in information when restricting to point queries as opposed to the more general linear queries., as well as the benefit of adaption. In addition, we also developed a general framework for function approximation to mitigate the curse of dimensionality that can also be easily adapted to incorporate further structure such as lower order interactions, leading to sample complexities better than those obtained earlier in the literature.
黄坚教授分别于1985年及1987年在武汉大学取得数学理学学士学位及数理统计硕士学位,并在1994年于美国华盛顿大学取得统计学哲学博士学位。在加入香港理工大学前,黄坚教授为美国爱荷华大学统计及精算系和生物统计系教授。黄坚教授的研究领域涉及高维统计,生物信息,生存分析和统计遗传学。黄坚教授在删失资料下非参数和半参数模型的统计推断,遗传资料的整合分析,高维模型下群组变量选择和双层变量选择,以及高维统计的理论和演算法等方面做出重要贡献,并在国际顶级学术刊物包括《Annals of Statistics》, 《Bioinformatics》, 《Biometrics》, 《Biometrika》, 《Econometrika》, 《Journal of the American Statistical Association》, 《Journal of Machine Learning Research》, 《PNAS》及 《The American Journal of Human Genetics》发表具有影响力的论文逾100篇。
报告主要内容:Generative adversarial networks (GANs) are a class of machine learning algorithms for unsupervised learning. The original GANs have a min-max formulation as a two-player game (Goodfellow et al. 2014). This method has found applications in many areas in statistics and machine learning. In this talk, we present a statistical perspective on GANs. We show that the min-max formulation of GANs can be considered a dual form of certain statistical divergence criterions. Therefore, GANs can also be implemented by optimizing their primal formulations. This leads to a different approach to generative learning via GANs. Some preliminary numerical results with image data are used to illustrate the performance of the proposed method.
在讲座接近尾声时,教授们和在座的老师进行了深刻的交流和讨论,耐心解答同学们提出的问题。此次讲座不仅拓宽了同学们的视野,同时也提高了老师们的学术素养,为大家提供了良好的学术交流平台。