用STATA怎么用spss做层次分析做VIF分析

点击联系发帖人 时间：2017-10-29 01:45

怎么用spss做回归分析

stata回归分析完整步骤-吐血推荐_百度文库
两大类热门资源免费畅读
续费一年阅读会员，立省24元！
stata回归分析完整步骤-吐血推荐
阅读已结束，下载文档到电脑
想免费下载本文？
定制HR最喜欢的简历
下载文档到电脑，方便使用
还剩39页未读，继续阅读
定制HR最喜欢的简历
你可能喜欢Stata统计分析命令_百度文库
两大类热门资源免费畅读
续费一年阅读会员，立省24元！
Stata统计分析命令
阅读已结束，下载文档到电脑
想免费下载本文？
定制HR最喜欢的简历
下载文档到电脑，方便使用
还剩9页未读，继续阅读
定制HR最喜欢的简历
你可能喜欢苹果/安卓/wp
积分 101, 距离下一级还需 44 积分
权限: 自定义头衔
道具: 彩虹炫, 涂鸦板, 雷达卡, 热点灯, 金钱卡, 显身卡下一级可获得
道具: 匿名卡
购买后可立即获得
权限: 隐身
道具: 金钱卡, 彩虹炫, 雷达卡, 热点灯, 涂鸦板
悲催签到天数: 3 天连续签到: 1 天[LV.2]偶尔看看I
& & 1.我研究的是高管-员工薪酬差距和公司绩效的相关关系，证明两者呈u性关系，我想问一下，我需要做多重共线性检验吗？因为多重共线性检验的是线性关系，而我验证的是u型关系关系，所以我想知道用不用做vif检验？2.因为我证明的是u型关系，所以存在高管-员工薪酬差距的一次方和二次方，他们之间的相关性很大，我们老师一定让我加vif检验，我老师说我要是不加必须有充足的理由，但我做了vif检验后，我的一次方和二次方的vif达到了6.55，我看有的文章说vif超过就存在多重共线性，就得解决这个问题，那我现在6.55，需要解决多重共线性问题吗？&&我实在是没办法了，老师让我一定要弄明白，我又是小白，写的还是u型关系，所以还希望懂得大神能帮忙解答一下，谢谢了。
支持楼主：、
购买后，论坛将把您花费的资金全部奖励给楼主，以表示您对TA发好贴的支持
载入中......
arron55 发表于
<font color="#.我研究的是高管-员工薪酬差距和公司绩效的相关关系，证明两者呈u性关系，我想问一下，我需要做多重共 ...超过10一般才认为存在额。不用担心的。祝好运～
最大的vif大于10，平均的vif大于1，同时满足这两个条件，说明存在多重共线性。
实际上，在线性回归中引入平方项，平方项与一次项的相关性肯定较大，而且导致原来的线性关系不存在。在考虑变量间呈 U 形关系时，如果是面板数据，可以采用门限模型；如果是时间序列数据，参考一般文献，平方项的引入，默认仍存在线性关系。
星期天的早晨发表于
实际上，在线性回归中引入平方项，平方项与一次项的相关性肯定较大，而且导致原来的线性关系不存在。在考虑 ...嗯嗯，谢谢谢谢！那现在我的最大一项vif才是6.55，但平均vif大于1，是不是就是不存在多重共线性问题，用reg回归就可以？
xddlovejiao1314 发表于
超过10一般才认为存在额。不用担心的。祝好运～谢谢
arron55 发表于
嗯嗯，谢谢谢谢！那现在我的最大一项vif才是6.55，但平均vif大于1，是不是就是不存在多重共线性问题，用r ...不存在。两个条件必须同时满足时，认为存在多重共线性。线性回归可以做。
星期天的早晨发表于
不存在。两个条件必须同时满足时，认为存在多重共线性。线性回归可以做。好的，谢谢，实在是太感谢了。但其实我想问一个问题，我要证明的是u型关系，那为什么我要做多重共线性检验呢？这不是要检验线性关系吗？
本帖最后由星期天的早晨于
20:33 编辑 arron55 发表于
好的，谢谢，实在是太感谢了。但其实我想问一个问题，我要证明的是u型关系，那为什么我要做多重共线性检验 ...如果你的数据是时间序列或者截面数据，这个是要做的，否则导致后面回归结果可能不理想。如果是面板数据，可以不用做。
你纠结的是要验证 U 形曲线的存在，那么就一定不是线性模型了，是非线性模型了，但像二次项，取对数之类的可以转化为线性模型，这个在模型回归结果后对U形关系可以作以说明，并不影响。再说说转化问题，在古典线性回归模型假定中，第一个假定：线性假定。这个是说模型线性与参数，不是线性于变量。或者说，每个解释变量对被解释变量的边际效应为常数，即被解释变量对解释变量的偏导数为常数，就是在模型中a1,a2,a3.
所以，如果你令x(k+1)等于平方项，那么在形式上就和原来的线性模型是一致的。
不知道你明白否？
本帖最后由星期天的早晨于
20:27 编辑
线性于，a1 ,a2 , a3为系数。
一级伯乐勋章
一级伯乐勋章
初级学术勋章
初级学术勋章
初级热心勋章
初级热心勋章
初级信用勋章
初级信用勋章
中级热心勋章
中级热心勋章
中级学术勋章
中级学术勋章
中级信用勋章
中级信用勋章
高级热心勋章
高级热心勋章
高级学术勋章
高级学术勋章
高级信用勋章
高级信用勋章
特级热心勋章
高级热心勋章
特级学术勋章
特级学术勋章
特级信用勋章
高级信用勋章
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
如有投资本站或合作意向，请联系（010-）；
邮箱：service@pinggu.org
投诉或不良信息处理：（010-）
论坛法律顾问：王进律师苹果/安卓/wp
积分 50, 距离下一级还需 35 积分
道具: 彩虹炫, 涂鸦板, 雷达卡, 热点灯, 金钱卡, 显身卡下一级可获得
权限: 自定义头衔
购买后可立即获得
权限: 隐身
道具: 金钱卡, 彩虹炫, 雷达卡, 热点灯, 涂鸦板
如何用STATA做方差膨胀因子检验，其具体操作步骤是什么？
载入中......
不会就用findit命令搜
你的问题解决是 estat vif
我这么做，怎么显示错误呢？
回归后，vif 即可
& &以下内容是我在做三重面板门限模型中得出的经验，至于理论上正确与否，暂时无从可知。仅提供给大家参考，因为这个问题，我看很多人在问，恰好我得到这一看法，贡献给大家。欢迎大家批评指正。
& &大家都有一个疑惑是不是estat vif只能用在非面板数据，的确在xtreg回归后是不能够使用该命令。那么我就疑惑是不是把面板数据按照一般回归命令后进行测试会不会有所偏误？我估计大家都有这个疑问。于是我就有意采用事后验证的方法去一探究竟。
& & 1、事先知道该面板数据存在，结果证据如下：
& & xtreg n r&&v&&c1 c2 c3 c4 ,fe vce(cluster cn)
note: c2 omitted because of collinearity
note: c3 omitted because of collinearity
note: c4 omitted because of collinearity
Fixed-effects (within) regression& && && && && &Number of obs& && &=& && & 731
Group variable: cn& && && && && && && && && && &Number of groups& &=& && &&&43
R-sq:&&within&&= 0.1419& && && && && && && && & Obs per group: min =& && &&&17
between = 0.0002& && && && && && && && && && && && && & avg =& && &17.0
overall = 0.0058& && && && && && && && && && && && && & max =& && &&&17
F(3,42)& && && && &=& && &4.86
corr(u_i, Xb)&&= -0.4375& && && && && && && && &Prob & F& && && &&&=& & 0.0054
(Std. Err. adjusted for 43 clusters in cn)
n& && & Coef.& &Std. Err.& && &t& & P&t& &&&[95% Conf. Interval]
r& &-5.142679& &2.585115& & -1.99& &0.053& & -10.35965& & .0742936
v& &-1.758395& &.6018545& & -2.92& &0.006& & -2.972987& &-.5438034
c1& & .7111485& &.3103662& &&&2.29& &0.027& &&&.0848041& & 1.337493
c2& &(omitted)
c3& &(omitted)
c4& &(omitted)
_cons& & 33.09937& &&&13.232& &&&2.50& &0.016& &&&6.396109& & 59.80264
sigma_u& &7.3228039
sigma_e& & 3.387647
rho& &.& &(fraction of variance due to u_i)
回归很明显，存在三个多重共性。
2、按照一般回归得出vif：
qui reg nex reer vat&&citd1 citd2 citd3 citd4
. estat vif
& & Variable |& && & VIF& && & 1/VIF&&
-------------+----------------------
& && && &v |& && &1.07& & 0.934221
& && & c1 |& && &1.05& & 0.955115
& && &&&r |& && &1.03& & 0.975260
-------------+----------------------
& & Mean VIF |& && &1.05
结果很明显，v、c1与r三个不存在多重共线性，而c2、c3与c4由于多重共线而被舍去。与上面事实吻合。
3、稳健性分析：通过以上两个结果的相互验证，本文结论estat vif可以用于面板数据是稳健可靠地。
希望这点实战经验，能对大家有用。
关于面板数据多重共线性检验的实战经验 - Stata专版 - 人大经济论坛
http://bbs.pinggu.org/forum.php?mod=viewthread&tid=3302287&extra=
总评分:&学术水平 + 3&
热心指数 + 4&
信用等级 + 3&
<font color="#73233 发表于
以下内容是我在做三重面板门限模型中得出的经验，至于理论上正确与否，暂时无从可知。仅提供给大家参考， ...&&Variable |& && & VIF& && & 1/VIF&&
-------------+----------------------
& && && &&&x |& && &1.10& & 0.905802
& & turnover |& && &1.27& & 0.786061
& && &&&size |& && &1.40& & 0.716019
& && && &roe |& &&&27.04& & 0.036985
& && && & mb |& &&&26.91& & 0.037167
& && && &lev |& && &1.52& & 0.657849
& &&&central |& && &1.13& & 0.882206
& && &&&year |
& && & 2012&&|& && &1.52& & 0.658636
& && & 2013&&|& && &1.59& & 0.629325
& && & 2014&&|& && &2.13& & 0.469592
-------------+----------------------
& & Mean VIF |& && &6.56
. 这样怎么看共线性，前后两两看嘛
mark，学习一下
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
如有投资本站或合作意向，请联系（010-）；
邮箱：service@pinggu.org
投诉或不良信息处理：（010-）
论坛法律顾问：王进律师【推荐】stata基本操作汇总——异方差、自相关、多重共线性
Stata检查是否存在异方差的方法：
1、看残差图，模型回归之后使用即可
rvfplot（残差与拟合值的散点图）
rvpplot（残差与解释变量的的散点图）
2、White检验
其基本命令是在完成基本的OLS 回归之后，输入
imtest， white
如果输出的P-Value 显著小于0.05，则拒绝原假设，即不存在异方差性
3、BP(Breusch and Pagan,1979)检验
关于stata处理异方差问题的命令
基本命令是：estat hettest var1 var2 var3
其中，var1 var2 var3 分别为你认为导致异方差性的几个自变量。是你自己设定的一个滞后项数量。
同样，如果输出的P-Value 显著小于0.05，则拒绝原假设，即不存在异方差性。
estat hettest（默认设置使用拟合值y_hat）
estat hettest（使用方程邮编的解释变量，而不是y_hat）
estat hettest varlist（指定使用某些解释变量）
方法一：WLS
WLS是GLS（一般最小二乘法）的一种，也可以说在异方差情形下的GLS就是WLS。在WLS下，我们设定扰动项的条件方差是某个解释变量子集的函数。之所以被称为加权最小二乘法，是因为这个估计最小化的是残差的加权平方和，而上述函数的倒数恰为其权重。
在stata中实现WLS的方法如下：
reg （被解释变量）（解释变量1）（解释变量2）…… [aweight=变量名]
其中，aweight后面的变量就是权重，是我们设定的函数。
一种经常的设定是假设扰动项的条件方差是所有解释变量的某个线性组合的指数函数。在stata中也可以方便地实现：
首先做标准的OLS回归，并得到残差项；
reg （被解释变量）（解释变量1）（解释变量2）……
predict r, resid
生成新变量logusq，并用它对所有解释变量做回归，得到这个回归的拟合值，再对这个拟合值求指数函数；
gen logusq=ln(r^2)
reg logusq (解释变量1) （解释变量2）……
predict g, xb
gen h=exp(g)
最后以h作为权重做WLS回归；
reg （被解释变量）（解释变量1）（解释变量2）…… [aweight=h]
如果我们确切地知道扰动项的协方差矩阵的形式，那么GLS估计是最小方差线性无偏估计，是所有线性估计中最好的。显然它比OLS更有效率。虽然GLS有很多好处，但有一个致命弱点：就是一般而言我们不知道扰动项的协方差矩阵，因而无法保证结果的有效性。
方法二：HC SE
There are 3 kinds of HC SE
（1）Huber-White Robust Standard Errors HC1，其基本命令是：
reg var1 var2 var3, robust White（1980）证明了这种方法得到的标准误是渐进可用（asymptotically valid）的。这种方法的优点是简单，而且需要的信息少，在各种情况下都通用。缺点是损失了一些效率。这种方法在我们日常的实证研究中是最经常使用。
（2）MacKinnon-White SE HC2，其基本命令是：
reg var1 var2 var3, hc2
（3）Long-Ervin SE HC3，其基本命令是：
reg var1 var2 var3, hc3
序列相关性问题的检验：首先，要保证所用的数据必须为时间序列数据。如果原数据不是时间序列数据，则需要进行必要的处理，最常用的方法就是：
这两个命令的意思是，首先要生成一个时间序列的标志变量n（或者t 也可以）；然后通过tsset 命令将这个数据集定义为依据时间序列标志变量n定义的时间序列数据。
最直观的检验方式是通过观察残差分布，其基本步骤是在跑完回归之后，直接输入
Predict error, stdp
这样就得到了残差值；然后输入命令：
plot error n
会得到一个error 随n 变化的一个散点图。
D-W检验——对一阶自相关问题的检验：
D-W检验是对一阶自相关问题的常用检验方法，但是如果实际问题中存在高阶序列相关性问题，则不能用这个检验方法。
D-W 检验的命令如下：
首先，输入回归命令，
reg Variable1 Variable2 Variable3…VariableM
输出一个简单的OLS估计结果。然后，再输入命令：
这时会输出一个DW 统计量。通过与临界值之间的比较，可以得出结论。也可以执行如下命令
estat durbinalt
直接进行Durbin检验。
Breusch-GodfreyTest in STATA——检验高阶序列相关性：
在得到一个基本回归结果和error 之后，我们假设这样一个关系：
et = α0 + α1 et-1 + α2 et-2 …+ αk et-p + β1 x1t + β2 x2t … +βk xkt +εt
BG 检验的原假设是：H0 ： α1 = α2 = … αp =0。
其基本命令是：
bgodfrey , lags(p)
其中p 是你自己设定的一个滞后项数量。如果输出的p-value 显著小于0.05，则可以拒绝原假设，这就意味着模型存在p 阶序列相关性；如果输出的p-value 显著大于0.05 甚至很大，则可以接受原假设，即不存在p 阶序列相关性。
处理序列相关性问题的方法——GLS：
常用的几种GLS 方法：
（1） Cochrane-Orcutt estimator 和Prais-Winsten estimator
其基本命令是
prais var1 var2 var3, corc
（2） Newey-West standard errors
其基本命令是
newey var1 var2 var3, lag(3)
其中，lag（3）意思是对三阶序列相关性问题进行处理；如果需要对p 阶序列相关性问题进行处理，则为lag（p）
t因变量，g,f,c是自变量，_26存放了弟26个观测值，为需要预测的值
reg t g f c if _n!=26
predict taxpredict if _n==26
均值的区间预测
predictnl py=predict(xb),ci(lb ub) l(95)
因变量的区间预测
adjust g= f=24649.95 c=99.9,stdf ci level(95)
多重共线性产生的原因
产生多重相关性的原因主要包括四方面:
①趋同性:经济变量随时间的变化过程存在共同变化趋势;
②用截面数据建模;
③模型中大量地采用滞后变量;
④建模时由于认识的局限性导致变量选择不当。
Stata检查是否存在多重共线的方法：
VIF值越大说明多重共线性问题越严重。
一般认为，最大的VIF不超过10，则不存在明显的多重共线性。
方差膨胀因子VIF是指回归系数的估计量由于自变量的共线性使其方差增加的一个相对度量。
经验式的诊断方法
通过观察，得到一些多重相关性严重存在的迹象。
①在自变量的简单相关系数矩阵中，有某些自变量的相关系数值较大。
②回归系数的代数符号与专业知识或一般经验相反;或者该自变量与因变量的简单相关系数符号相反。
③对重要自变量的回归系数进行t检验，其结果不显著。特别是当F检验能在高精度下通过，测定系数R2的值也很大，但自变量的t检验却全都不显著，这时多重相关性的可能将会很大。
④如果增加或删除一个变量，或者增加或删除一个观测值，回归系数发生了明显的变化。
⑤重要自变量的回归系数置信区别明显过大。
⑥在自变量中，某一个自变量是另一部分自变量的完全或近似完全的线性组合。
⑦对于一般的观测数据，如果样本点的个数过少，比如接近于变量的个数或者少于变量的个数，样本数据中的多重相关性就会经常存在。
消除多重共线性的方法
解决办法概要：1、如果只关心方程的预测能力，则在整个方程显著的条件下，可以不必关心具体的回归系数。2、增加样本容量，剔除导致多重共线性的变量或者修改模型设定形式。3、对于时间序列样本，通过使用差分模型可以一定程度上消除原模型中的多重共线性。4、岭回归方法。5、逐步回归分析方法
解决办法更详细内容如下：
（1）真实的要素不可替代还是虚假的要素不可替代
在实际的经济计量过程中，多重共线性和要素之间的替代关系的经济学命题之间并不是严格对称的。我们可以说，只要要素之间同比例变动，经济计量模型中，就会出现多重共线性，但是反论则不一定成立。因为实际经济计量中影响多重共线性的原因很多。以生产函数为例，L和K高度线性相关可能存在于时间序列的模型中，因为L、K的变动均表现在时间上的连续性。因此尽管实际生活中二者有显著的替代关系，但在统计数据上因二者均随时间变化，故显示出很高的线性关系。多重共线性也可能存在于截面数据模型之中，因在现实中，企业资本量和劳动者数量与企业规模之间存在着确定关系，使得截面模型中的劳动和资本的统计数据也可能高度相关，甚至接近完全相关。在上述两种情况下，虽均存在着高度的多重共线性，但实际中要素之间却是可以相互替代的。从经济学意义上讲，’要素之间不可替代或是成固定比例替代都不是常态。因此，在经济定量分析中，对于第二种多重共线性情况，应首先寻找统计数据生成的因素并予以消除。
（2）增加经济变量的样本容量
当增加样本容量时，有可能改变某些经济变量的变化趋势，从而消除经济变量间的多重共线性。
（3）合并截面和时间序列数据
合并的方法是:由截面数据求出模型中一个或更多的系数估计值，’再从被解释变量中减去含有这些估计值的参数项，然后用它们的差作被解释变量，以时间序列的样本估计保留系
数的估计值。
（4）去掉某些对被解释变量影响不大的解释变量。用逐步回归法。
逐步回归法的基本思路是：首先将Y对其中一个解释变量回归，然后逐个加入其它解释变量，并将对被解释变量影响不大的解释变量筛选掉。或首先将Y对所有解释变量回归，然后筛选掉对被解释变量影响不大的解释变量。
逐步回归分析方法是综合了逐步剔除法和逐步引入法的特点产生的方法。其基本原理为：从一个自变量出发，视自变量对因变量的影响显著性大小，从大到小引入回归方程，同时，在逐个自变量选人回归方程中，如果发现先前被引入的自变量在其后由于某些自变量的引入而失去其重要性，可以从回归方程中随时予以剔除。引入一个变量或剔除一个变量，为逐步回归的一步，每步都要进行显著性检验，以便保证每次引入变量前回归方程中只包括显著性变量，这个过程反复进行，直到既无不显著变量从方程中剔除，又无显著变量需要引入回归方程为止。
剔除一些不重要的变量。当面临严重的共线性时，一种最简单的方法就是去掉不太重要的自变量。但决定保留或剔除哪些自变量并不是一件容易的事。因此，如何判断某个变量是否重要，是此方法的关键。从模型中删除一个变量，还可能导致设定偏误。
（5）余差估计法
《数量经济技术经济研究》杂志1990年第4期发表的陕西财经学院郭其阳同志的文章中，用余差估计法消除多重共线性，我们认为是可行的。
（6）主成分估计
这是一种处理严重共线性的有偏估计方法。它利用主成分分析对自变量系统进行变量综合，然后将综合后的新变量作为解释变量，再进行 OLS
回归，得到主成分估计。然而，主成分估计的结果必然受到重叠信息的影响。另外主成分估计提取的主成分与因变量关系也不密切，使模型的拟合效果降低; 主成分的实际含义也不明确。
（7）岭回归
岭回归也是有偏估计方法。当出现严重共线性时，岭估计往往比 OLS
估计量更稳定，以及更小的协方差矩阵。岭估计的最大困难是最优k值的选择。尽管人们提出了许多确定k值的原则和方法，但理论上还未得到满意答案。实际应用中必须通过样本来确定，存在明显的主观性。另外K 的真实含义也不清楚。
以上介绍了几种简单的消除多重共线性的方法。还有其它一些方法，例如参数约束修正法，主要分量法，岭回归估计方法等等，在此不再一一叙述。
阅读原文，探索更多↓↓↓
责任编辑：
声明：本文由入驻搜狐号的作者撰写，除搜狐官方账号外，观点仅代表作者本人，不代表搜狐立场。
今日搜狐热点}

叫阿莫西中心