绑定机构
扫描成功 请在APP上操作
打开万方数据APP,点击右上角"扫一扫",扫描二维码即可将您登录的个人账号与机构账号绑定,绑定后您可在APP上享有机构权限,如需更换机构账号,可到个人中心解绑。
欢迎的朋友
万方知识发现服务平台
获取范围
  • 1 / 1
  (已选择0条) 清除 结果分析
找到 1 条结果
[硕士论文] 李勋健
应用统计 山东大学 2018(学位年度)
摘要:在统计学学科中,变量筛选问题已经有几十年的研究历史。在传统的线性统计模型中,逐步回归是一个非常有效的用来做变量筛选的统计方法。但逐步回归在处理高维数据的时候,该方法所存在的效率严重低下的问题就开始暴露出来了。从Tibshirani(1996)提出Lasso估计开始,变量筛选就成为一个新的热门领域被统计学家推广,并且发展得到了很多新的模型。
  作为本文的一个重要工作之一,就是梳理变量筛选模型的发展演变,以及探讨变量筛选模型的行之有效的基本原理。Tibshirani(1996)提出Lasso估计,解决了传统线性模型所不能解决的变量数目远大于样本量的问题。Lasso方法不仅可以得到良好的参数估计,并且还能达到减少无关变量的数目,精简模型的目的。为了有效的得到Lasso方法的参数估计,Fu在1998年提出了“shooting”算法;Osbome,M.R.随即提出了Forward-Stepwise Selection和Forward-Stagewise Regression算法;Efron在2004年提出了LARS。这些算法的提出,本身就是对Lasso方法有效性的最好的阐释。受这些算法的启发,本文将从“效用”角度阐释Lasso方法具备变量筛选的原理和岭回归在变量筛选中的失效问题。Lasso方法也有其天然的缺陷,得到模型的参数估计是有偏的,并且估计结果不稳定。Fan和Li(2001)提出一个优秀的估计模型的标准就是模型需要满足Oracle性质,即无偏性,稀疏性和连续性,并给出满足Oracle性质的SCAD方法。在新的标准下,更多的满足Oracle性质的方法被提出。Zou和Hastie(2005)提出了Elastic Net Lasso;Zou(2006)提出Adaptive Lasso;Yuan和Lin(2006)提出了Group Lasso等。与SCAD方法不是凸优化不同的是,上述方法的优化问题都满足凸优化的性质,即需要优化的目标函数的局部最优等于全局最优。并且Elastic Net Lasso和Group Lasso由于添加了二范数惩罚,使得变量筛选模型具备“组效应”,从而避免了在两个有较高相关性的有效变量中,只能选择一个变量的问题。为了能够更直观地比较各方法的优劣,文中给出了一些实例,并给出各自模型的计算效果。
  本文还将介绍近年来变量筛选模型的变化趋势。将简要介绍Bien,Taylor和Tibshirani(2010)提出的All Pairs Lasso,Tibshirani和Friedman(2018)提出了Pliable Lasso。他们是拥有等级交互效应的Lasso模型的变异,能够针对特定的目标群体,自行修改得到估计参数,以提高模型的估计精度。
  本文着力从“效用”角度去解释各个方法的原理,用更加清晰地方式认识变量筛选的原理,阐释各自方法的优劣。本文还将给出几个与Lasso有关的推广和应用。给出一个Stagewise的推广算法。由于变量模型逐步向复杂化方向发展,缺乏根本性的创新,本文在最后章节将指出现在变量筛选模型变化趋势所存在的问题。
  (已选择0条) 清除
公   告

北京万方数据股份有限公司在天猫、京东开具唯一官方授权的直营店铺:

1、天猫--万方数据教育专营店

2、京东--万方数据官方旗舰店

敬请广大用户关注、支持!查看详情

手机版

万方数据知识服务平台 扫码关注微信公众号

万方选题

学术圈
实名学术社交
订阅
收藏
快速查看收藏过的文献
客服
服务
回到
顶部