二元logit模型怎样在stata做logit分析详解中画累计概率分布图

计量分析与 STATA 应用
钟经樊 连玉君
关于作者: 钟经樊 台湾中央研究院 经济研究所       连玉君 中山大学 岭南学院 金融系
中文版本: 版本 2.0,二○一○年六月
钟经樊和连玉君拥有版权 c 2007 – 2010。 保留所有权利。
这份文档是我们即将出版的书稿,目前免费提供给中山大学岭南学院的师生使用。 发布这份文档的目的有二: 其一,用做授课讲义,帮助岭南学院的同学们学习 STATA; 其二,恳请大家对书稿提出修改意见,包括书稿的结构安排、表述错误,以及错别字等细节。
书稿的使用仅限于岭南学院范围内,请勿外传或散布于网络。
第十五章 Logistic 模型 15.1 简介 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.2 二元 Logit 模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.2.1 二项分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.2.2 Logit 变换 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.2.3 Logistic 模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.2.4 估计 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.2.5 假设检验 15.3 多元 Logit 模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.2.6 模型的解释和拟合优度 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.3.1 估计 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.3.2 假设检验 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.3.3 拟合优度 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.3.4 模型的解释 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.4 STATA 中有关 Logitech 模型的命令概览 . . . . . . . . . . . . . . . . . . . . . . . . 1 1 1 1 2 2 3 6 7 12 12 18 27 28 33
Logistic 模型
在过去的二十年中,logistic 模型在众多领域得到了广泛的应用,甚至成为部分领域的标 准分析方法。 logistic 模型与线性模型的最大区别就在于前者的被解释变量是二元变量 (binary) 或取值有限的离散变量 (dichotomous)。这种区别使得两种模型的参数设定和假设条件都存在差 异。在充分考虑这些差异的前提下,前面介绍的用于分析线性模型的基本规则同样适用于分析 logistic 模型。当然,由于 logistic 模型的非线性特征,在分析过程中还需要引入一些新的统计 和评估方法。
二元 Logit 模型
假设我们想要研究上市公司债务融资行为的决定因素,被解释变量 yi 为上市公司是否发行 债务。显然, yi 是一个二元变量,只有 0 和 1 两个取值,定义如下: yi = 1 若第 i 家公司发行债务 0 其它 (15-1)
我们可以将 yi 视为随机变量 Yi 的实现值,Yi 有 1 和 0 两个取值,相应的概率分别为 πi 和 1 ? πi 。 Yi 服从贝努力 (Bernoulli) 分布,参数为 πi ,可表示为 Pr Yi = yi = πi i (1 ? πi )1? yi ,
其中, yi = 0, 1.
显然,若 yi = 1,则上式为 πi ;若 yi = 0,则上式为 1 ? πi 。 易于证明,Yi 的期望和方差分别为: E(Yi ) = ?i = πi Var(Yi ) = σi = πi (1 ? πi ) 1
15.2 二元 LOGIT 模型
可见,期望和方差都决定于 πi 。任何影响概率的因素不但会影响观察值的的均值,也会影响其 方差。这表明前面介绍的线性模型无法用于分析二元变量,因为线性模型假设方差是固定不变 的。
Logit 变换
线性变换 为了使上述模型更富有弹性,我们假设概率 πi 受一系列变量的影响,设定为 xi 。 一个非 常直觉的想法是把二者之间的关系设定为线性函数: πi = xi β , 其中,β 为系数向量。该模型通 常称为线性概率模型,采用普通最小二乘法估计即可。 其主要缺陷在于:由于等式左边的 πi 表示概率,所以必须介于 0 和 1 之间,而右边的线性 组合项则可能取任何值,所以在不对模型做严格约束的情况下,我们很难保证模型的预测值介 于合理的范围内。 logit 变换 因此,我们必须对概率 πi 进行变换以消除对其取值范围的约束,继而把变换后的数值 设 定为解释变量 xi 的线性函数。处理过程包括两个步骤。 第一步,我们依据概率 πi 来定义胜算比 (odds) :
πi , 1 ? πi
即 yi = 1 的概率 πi 与 yi = 0 的概率 (1 ? πi ) 的比值。显然,胜算比可以取任意非负值,如此便 可消除上限约束。 第二步,取对数以计算 logit 或 log-odds logit(πi ) = ln(
πi 1 ? πi
这样我们就可以去除下限约束。因为,随着概率 πi 趋近于 0 ,logit 将趋近于 ?∞ ; 而当概率 πi 趋近于 1 ,logit 将趋近于 +∞ 。因此,通过以上变换,logit 将概率 πi 的取值范围从 (0, 1) 映 射至整个实数轴。显然,如果概率为 0.5,胜算比为 1,相应的 logit 为 0。logit 为负表示概率小 于 0.5,反之则表示概率大于 0.5。图 15-1 说明了上述变换的对应关系。
Logistic 模型
在完成了上述变换后,我们就可以定义 Logistic 回归模型了,此时我们假设概率 πi 的 Logit 变换 (而非概率 πi 本身) 服从线性模型,即 logit(πi ) = ln πi 1 ? πi = xi β , (15-6)
其中,xi 为解释变量构成向量,β 为系数向量。
第十五章 LOGISTIC 模型
100 80 60 40 20 0 0 .2 .4 .6 Probability .8 1 Probability
1 .8 .6 .4 .2 0 ?4 ?2 0 Logit (log?odds) 2 4
感觉不错的话,微信扫一扫关注官方微信公众账号,以后找资料更方便
是互联网分享学习的开放平台,汇集亿份高价值的文档资料,涵盖档下载,程序开发文档,教育文档,医药文档,办公文档,考试文档,营销文档,工程文档,分享文档等行业。为您提供愉悦的分享学习体验。
连玉君_Logit模型STATA
你可以免费下载该文档
没满足你的要求? 查找更多相关内容君,已阅读到文档的结尾了呢~~
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
stata上机实验第六讲 离散选择模型
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='/DocinViewer-4.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口苹果/安卓/wp
积分 1299, 距离下一级还需 76 积分
权限: 自定义头衔, 签名中使用图片, 隐身
道具: 彩虹炫, 涂鸦板, 雷达卡, 热点灯, 金钱卡, 显身卡, 匿名卡, 抢沙发下一级可获得
权限: 设置帖子权限道具: 提升卡
购买后可立即获得
权限: 隐身
道具: 金钱卡, 彩虹炫, 雷达卡, 热点灯, 涂鸦板
开心签到天数: 28 天连续签到: 2 天[LV.4]偶尔看看III
多项logit模型好像默认的自变量都是连续变量吧,那么,如果自变量中有分类变量,用stata如何针对此变量设置参照组呢?求解,谢谢。
用tab var,gen(var)试试生成虚拟变量
载入中......
这世界笑了,于是你合群地一起笑了。。。
用tab var,gen(var)试试生成虚拟变量
本帖最后由 statalearning 于
10:55 编辑
还是看楼下的指导。
本帖最后由 蓝色 于
01:20 编辑
看帮助Factor variables的解释
& & [U] 11.4.3 Factor variables
Base levels
& & You can specify the base level of a factor variable by using the ib. operator.&&The syntax is
& && && &&&Base& && && &
& && && &&&operator(*)& & Description
& && && &&&---------------------------------------------------------------------------------------------------------
& && && &&&ib#.& && && &&&use # as base, #=value of variable
& && && &&&ib(##).& && &&&use the #th ordered value as base (**)
& && && &&&ib(first).& &&&use smallest value as base (the default)
& && && &&&ib(last).& && &use largest value as base
& && && &&&ib(freq).& && &use most frequent value as base
& && && &&&ibn.& && && &&&no base level
& && && &&&---------------------------------------------------------------------------------------------------------
& && && && &(*) The i may be omitted.&&For instance, you may type ib2.group or b2.group.
& && && &&&(**) For example, ib(#2). means to use the second value as the base.
& & If you want to use group==3 as the base in a regression, you can type,
& && &&&. regress y&&i.sex ib3.group
& & You can also permanently set the base levels of categorical variables by using the fvset command.
Selecting levels
& & You can select a range of levels -- a range of virtual variables -- by using the i(numlist). operator.
& && && &Examples& && && & Description
& && && &-----------------------------------------------------------------------------------------------------------
& && && &i2.cat& && && && &a single indicator for cat==2
& && && &2.cat& && && && & same as i2.cat
& && && &i(2 3 4).cat& && &three indicators, cat==2, cat==3, and cat==4;
& && && && && && && && && &&&same as i2.cat i3.cat i4.cat
& && && &i(2/4).cat& && &&&same as i(2 3 4).cat
& && && &2.cat#1.sex& && & a single indicator that is 1 when cat==2 and sex==1, and is 0 otherwise
& && && &i2.cat#i1.sex& &&&same as 2.cat#1.sex
& && && &-----------------------------------------------------------------------------------------------------------
Stata版版规
xi: 是专门生成分类变量dummy的命令,还用来生成分类变量和其它变量的交叉项,分类变量放在前面,比如 i.rep78*gear_ratio,
xi: regress mpg i.rep78
生成的变量有 (每个都是判断变量,比如_Irep78_2 , 如果rep78==2,则回馈1,否则0)
_Irep78_2& && &
_Irep78_3& && &
_Irep78_4& && &
_Irep78_5&&
rep78==1的自动作为参照组,省去(omitted),为避免多重共线性,即变量间可以用线性关系表示。
这样,所有回归出的分类变量上的系数都是相对于参照组rep78==1而言的。
不爱其亲而爱他人者,谓之悖德;不敬其亲而敬他人者,谓之悖礼。——《孝经》
初级热心勋章
初级热心勋章
初级信用勋章
初级信用勋章
初级学术勋章
初级学术勋章
中级学术勋章
中级学术勋章
中级热心勋章
中级热心勋章
中级信用勋章
中级信用勋章
高级热心勋章
高级热心勋章
高级信用勋章
高级信用勋章
无限扩大经管职场人脉圈!每天抽选10位免费名额,现在就扫& 论坛VIP& 贵宾会员& 可免费加入
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
如有投资本站或合作意向,请联系(010-);
邮箱:service@pinggu.org
投诉或不良信息处理:(010-)
京ICP证090565号
论坛法律顾问:王进律师下载作业帮安装包
扫二维码下载作业帮
1.75亿学生的选择
关于用stata做二元选择模型的步骤我要用stata软件做一个二元选择模型,是截面数据,本人计量经济学当初没有好好学习,现在非常非常后悔,不太清楚统计完指标做出模型以后该做哪些相关的检验,(请尽量详细,本人要做论文.
瑟瑟同学9夅q
statistics --> binary outcomes --> probit regression 在菜单的 dependent variable中选取你的0-1型变量(因变量)
independent variable 中选取你的自变量,运行即可
谢谢!这个我懂,我的意思是说,需要进行哪些检验?有特别严格的步骤吗?请您指点一二!
总体模型是否有意义,主要看显著性检验,这里是结果输出中 P>|z| 的值,如果小于0.05,就完全没问题;0.05~0.1变量的显著性不强,有时也可以凑合;如所有系数均>0.1,模型失败。
谢谢你哦!我刚开始选取了13个指标,结果只有3个指标的P>|Z|的值在0.1一下,剩下的指标还得调整,再请教一下:Pseudo R2就是模型的拟合优度R平方吗?
我第一次做出的结果显示如下:
LR chi2(13)
Prob > chi2
Log likelihood = -150.95043
请问这些数据各自代表什么,能说明什么呢?
Pseudo R2不是模R平方,但非常类似。对于微观计量模型来说,这几个指标都没多大意义,关键还是显著性检验。只要有一个自变量通过显著性检验,模型就算是有一定的合理性了。
为您推荐:
其他类似问题
扫描下载二维码}

我要回帖

更多关于 stata logit回归命令 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信