2025年6月5日下午,中国人民大学黄丹阳教授应邀来我校开展了以“Boosted Independence Test for Rare Events with Applications in Vertical Federated Learning”为主题的学术讲座。本次讲座在综合楼644会议室举行,由统计与数学学院张立新教授主持。
黄丹阳,中国人民大学统计学院教授,吴玉章青年学者,中国人民大学国家治理大数据和人工智能创新平台北京市消费大数据监测子实验室主任。主持国家自然科学基金面上项目、北京市社会科学基金重点项目等科研课题,入选北京市科协青年人才托举工程,曾获北京市优秀人才培养资助。从事网络数据模型、大规模数据计算等方向的理论研究,关注统计理论在中小企业数字化发展中的应用。研究成果三十余篇发表于JRSSB、JASA、JOE、JBES等权威期刊。独著专著《大规模网络数据分析与空间自回归模型》入选“京东统计学图书热卖榜”。获北京高校青年教师教学基本功比赛二等奖、最受学生欢迎奖等多项省部级教学奖励。
在讲座中,黄丹阳教授深入探讨了稀有事件独立性检验的挑战与创新方法。她首先指出传统观念中“样本量越大信息越多”的假设功效主要由稀有事件的数量而非总样本量决定。这一发现不仅适用于固定维度统计环境,也在高维数据分析中得到验证。她强调,若忽视稀有事件的特殊性,可能导致统计推断失误,尤其在医疗异常检测、金融欺诈预防等关键领域影响深远。为解决这一问题,她提出了两种创新性方法:一是重缩放协方差,通过调整模型以更好适应稀有事件的数据特性;二是增强型程序,仅利用少量非稀有事件数据,就能实现与全数据集近似的检验功效,从而大幅降低计算复杂度,为大数据分析开辟了高效路径。她进一步阐述了这些方法的理论基础,通过推导渐近分布和局部功效分析,确保方法的稳健性和可靠性。此外,黄丹阳教授展示了其研究在垂直联邦学习中的应用,提出了垂直联邦特征筛选(VFS)算法,有效优化计算和通信效率,满足数据隐私保护与跨组织协作的需求。她以严谨的理论证明和数值实验验证了VFS算法的有效性,并指出其在金融、医疗、网络安全等领域的广泛应用潜力。
在讲座的最后,黄丹阳教授对大家的热情参与表示感谢,并鼓励研究者将这些方法应用于解决中小企业数字化发展等现实问题,以推动统计理论在实践中的创新应用。此次讲座内容丰富、深入浅出,为在场师生带来了关于稀有事件独立性检验的全新视角,张立新老师对此次讲座发表总结并对黄丹阳教授的精彩分享以及在场观众的参与互动表达了诚挚的感谢。