题目:A Goodness-of-fit Assessment for General Learning Procedure in High Dimensions
报告人:朱利平
报告时间:2024年12月18日(周三) 16:45-17:30
地点: 综合楼644会议室
报告人简介:
中国人民大学教授、博士生导师,学校和理工学部学术委员会委员,统计与大数据研究院院长,人民教育出版社普通高中教科书《数学》联合主编,国家重大人才工程入选者,国家杰出青年科学基金获得者,国家重点研发计划首席科学家,兼任中国现场统计研究会生存分析分会理事长和高维数据统计分会副理事长等。
先后受邀担任国际统计学领域顶级学术期刊《统计年刊》、国际权威学术期刊《中华统计学》和《多元分析》等副主编,以及国内统计学领域顶级学术期刊《中国科学·数学》(中、英文版)、《系统科学与数学》(中、英文版)和《应用概率统计》等青年编委、编委和副主编等。
长期从事大数据统计学基础理论、方法和应用研究。1、在高维度大数据领域,提出不依赖于切片数的累积切片估计方法、不依赖于分布条件的半参数降维方法和不依赖于模型的变量筛选方法,解决了充分降维领域“公开问题”,被认为是该领域“突破性进展”,被列为变量筛选领域“基准方法”。2. 在非线性大数据领域,提出投影相关系数度量非线性相关关系,广泛应用于类脑科学和天文学等研究中;原创性提出区间分位数相依基本思想,扩宽了(分布)独立基本概念并建立了(分布)独立与分位数独立和均值独立的联系。3.在大数据应用领域,主持开发的虚假诉讼预警甄别系统已经在四川省高级人民法院和成都市中级人民法院等10家法院部署应用示范,参与编写的人民法院信息化标准《民事案件信息技术规范》已被最高人民法院发布实施。
报告摘要:
Black-box learners have demonstrated remarkable success across various fields due to their high predictive accuracy. However, the complexity of their learning procedures poses significant challenges in evaluating whether a given learner has achieved optimal performance on datasets with unknown data-generating mechanisms. We propose a general goodness-of-fit test for assessing different learning procedures involving high-dimensional predictors, encompassing methods from classical linear regression to advanced neural networks. Our goodness-of-fit test leverages data-splitting, utilizing the test set to evaluate the black-box learner trained on the training set. This evaluation is based on examining the cumulative covariance of the residuals. Extensive simulations and two real data analyses validate the effectiveness of our method.
上一条: 没有了 |
下一条: 没有了 |