主题:大数据背景下两阶段Leverage重要性抽样方法研究
主讲人:贺建风 华南理工大学
主持人:陈光慧 暨南大学
时间:2024年9月26日(周四)下午15:40-16:40
地点:暨南大学石牌校区经济学院大楼(中惠楼)202室
摘要
大数据背景下,需要对传统的抽样调查技术进行改进,以应对数据结构变化的现实。以杠杆得分为入样概率的Leverage重要性抽样能够增加高杠杆值样本点被抽中的概率,但也增加了异常值选入抽样子集的风险,使得抽样估计偏离真实值。为了降低大数据异常值影响,提高大数据抽样子集估计的稳健性,本研究提出基于阈值自选择的两阶段Leverage重要性抽样方法。该方法第一阶段以样本距离的有序聚类识别稳健子集,使得用于二阶段抽样的样本更具代表性,第二阶段则是在稳健子集的基础上获得稳健抽样估计。模拟分析结果表明:本研究所提方法能够提升线性回归系数估计的精度,在漂移型、波动型和混合型离群值中均适用。实证分析中本研究所提方法在两个案例数据中拥有较小的预测值均方误差,有效降低了异常值的影响。
主讲人简介
贺建风,华南理工大学经济与金融学院教授、博士生导师、广东省“千百十”人才工程第六批培养对象、广东省百名统计学(专)家,现任广东省政协委员、华南理工大学数量经济学系主任、数字乡村与文旅可持续发展重点实验室副主任,民建华南理工大学支部副主委。同时,兼任中国商业统计学会常务理事、中国统计教育学会理事、广东省统计学会常务理事、国家社科基金评审专家、广东省社科基金评审专家、广东省政府综合评标专家、广东省发展和改革委员会项目评审专家、广东省高级统计师会评专家、广东省农业项目评审专家。主持国家社科基金(3项)、教育部人文社科基金(1项)、国家统计局全国统计科研基金(重大1项,一般2项)和广东省科技计划项目(6项)、广州市社科规划项目(重大1项,智库2项,一般2项)等国家级和省部级以上课题20多项。主持广东省委财经委、广东省发改委、广东省财政厅、广东省统计局等地方政府部门有关经济社会发展、共同富裕、宏观经济测算、科技创新政策、金融发展与产业政策评估以及商贸消费促进经济增长等横向咨询课题20多项。在《统计研究》《数量经济技术经济研究》《数理统计与管理》《世界经济文汇》,Applied Economics Letters,Computational Statistics等国内外重要期刊公开发表学术论文80多篇,其中多篇文章被《人大复印资料》《高等学校文科学术文摘》《人民智库》和“中国社会科学网”全文转载。同时,还获第十届广东省哲学社会科学优秀成果奖等多项省级以上科研奖励。
欢迎感兴趣的师生参加
校对| 陈光慧
责编| 彭 毅
初审| 姜云卢
终审发布| 何凌云
(来源:暨南大学经济学院微信公众号)