2026年4月23日上午,中山大学管理学院曾奕程副教授应邀来我校开展以“Missingness-Adaptive Factor Identification in High-Dimensional Data”为主题的学术讲座。本次讲座在综合楼644会议室举行,由统计与数据科学学院王励励副教授主持。

曾奕程,中山大学管理学院副教授、博士生导师。先后在浙江大学数学学院获硕士学位、香港浸会大学数学系获博士学位,随后在加拿大多伦多大学统计系从事博士后研究。曾奕程副教授的主要研究方向包括高维统计、随机矩阵理论及其在高维统计与机器学习中的应用。其研究成果发表在Statistica Sinica、Bioinformatics、JMVA、CSDA等统计学期刊,以及ICML、NeurIPS等顶级机器学习会议上。他主持国家自然科学基金青年项目和深圳市优秀科技创新人才培养项目各一项。

讲座中,曾奕程副教授围绕高维因子模型在缺失数据背景下因子个数的确定这一基础和前沿问题,展开了系统而深入的讲解。他首先指出,当数据存在缺失时,如何可靠地恢复并确定因子个数,一直是该领域的核心挑战。针对这一难题,曾奕程副教授创新性地提出了“可识别因子”的概念,即那些即使存在缺失观测也能被稳定恢复的因子。在此基础上,他进一步提出了缺失自适应阈值估计方法(Missingness-Adaptive Thresholding Estimator, MATE)。MATE是首个能够在不需要数据插补的前提下,同时适应同质和异质缺失模式,且不施加严苛因子强度假设的因子个数确定框架。该方法巧妙地绕过了传统方法中计算量巨大的插补步骤,显著降低了运算负担。曾奕程副教授严密论证了MATE在不同结构条件下的相合性,并利用大量数值模拟和真实数据案例展示了所提方法的优越性——在保证或提升表现的同时,一致地优于当前最先进的方法。整场报告思路清晰、论证严谨,为高维因子模型和缺失数据分析提供了全新的视角和有力的工具。

讲座结束后,曾奕程副教授与在场师生围绕缺失数据下次优因子识别、MATE方法的理论拓展及其在管理学、生物统计等领域的应用前景等问题,展开了热烈而深入的讨论。交流环节不仅深化了大家对高维缺失数据建模的理解,也进一步激发了新的研究兴趣。最后,王励励副教授对本次讲座进行了简要总结,并对曾奕程副教授的精彩报告和与会师生的积极参与表达了诚挚的感谢。
文|李瑾瑜
