二元logit模型怎样在stata做logit分析详解中画累计概率分布图

点击联系发帖人 时间：2016-09-08 02:23

stata logit回归命令

计量分析与 STATA 应用
钟经樊连玉君
关于作者：钟经樊台湾中央研究院经济研究所　　　　　连玉君中山大学岭南学院金融系
中文版本：版本 2.0，二○一○年六月
钟经樊和连玉君拥有版权 c 2007 – 2010。保留所有权利。
这份文档是我们即将出版的书稿，目前免费提供给中山大学岭南学院的师生使用。发布这份文档的目的有二：其一，用做授课讲义，帮助岭南学院的同学们学习 STATA；其二，恳请大家对书稿提出修改意见，包括书稿的结构安排、表述错误，以及错别字等细节。
书稿的使用仅限于岭南学院范围内，请勿外传或散布于网络。
第十五章 Logistic 模型 15.1 简介 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.2 二元 Logit 模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.2.1 二项分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.2.2 Logit 变换 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.2.3 Logistic 模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.2.4 估计 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.2.5 假设检验 15.3 多元 Logit 模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.2.6 模型的解释和拟合优度 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.3.1 估计 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.3.2 假设检验 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.3.3 拟合优度 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.3.4 模型的解释 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.4 STATA 中有关 Logitech 模型的命令概览 . . . . . . . . . . . . . . . . . . . . . . . . 1 1 1 1 2 2 3 6 7 12 12 18 27 28 33
Logistic 模型
在过去的二十年中，logistic 模型在众多领域得到了广泛的应用，甚至成为部分领域的标准分析方法。 logistic 模型与线性模型的最大区别就在于前者的被解释变量是二元变量 (binary) 或取值有限的离散变量 (dichotomous)。这种区别使得两种模型的参数设定和假设条件都存在差异。在充分考虑这些差异的前提下，前面介绍的用于分析线性模型的基本规则同样适用于分析 logistic 模型。当然，由于 logistic 模型的非线性特征，在分析过程中还需要引入一些新的统计和评估方法。
二元 Logit 模型
假设我们想要研究上市公司债务融资行为的决定因素，被解释变量 yi 为上市公司是否发行债务。显然， yi 是一个二元变量，只有 0 和 1 两个取值，定义如下： yi = 1 若第 i 家公司发行债务 0 其它 (15-1)
我们可以将 yi 视为随机变量 Yi 的实现值，Yi 有 1 和 0 两个取值，相应的概率分别为 πi 和 1 ? πi 。 Yi 服从贝努力 (Bernoulli) 分布，参数为 πi ，可表示为 Pr Yi = yi = πi i (1 ? πi )1? yi ,
其中， yi = 0, 1.
显然，若 yi = 1，则上式为 πi ；若 yi = 0，则上式为 1 ? πi 。易于证明，Yi 的期望和方差分别为： E(Yi ) = ?i = πi Var(Yi ) = σi = πi (1 ? πi ) 1
15.2 二元 LOGIT 模型
可见，期望和方差都决定于 πi 。任何影响概率的因素不但会影响观察值的的均值，也会影响其方差。这表明前面介绍的线性模型无法用于分析二元变量，因为线性模型假设方差是固定不变的。
Logit 变换
线性变换为了使上述模型更富有弹性，我们假设概率 πi 受一系列变量的影响，设定为 xi 。一个非常直觉的想法是把二者之间的关系设定为线性函数： πi = xi β , 其中，β 为系数向量。该模型通常称为线性概率模型，采用普通最小二乘法估计即可。其主要缺陷在于：由于等式左边的 πi 表示概率，所以必须介于 0 和 1 之间，而右边的线性组合项则可能取任何值，所以在不对模型做严格约束的情况下，我们很难保证模型的预测值介于合理的范围内。 logit 变换因此，我们必须对概率 πi 进行变换以消除对其取值范围的约束，继而把变换后的数值设定为解释变量 xi 的线性函数。处理过程包括两个步骤。第一步，我们依据概率 πi 来定义胜算比 (odds) ：
πi , 1 ? πi
即 yi = 1 的概率 πi 与 yi = 0 的概率 (1 ? πi ) 的比值。显然，胜算比可以取任意非负值，如此便可消除上限约束。第二步，取对数以计算 logit 或 log-odds logit(πi ) = ln(
πi 1 ? πi
这样我们就可以去除下限约束。因为，随着概率 πi 趋近于 0 ，logit 将趋近于 ?∞ ；而当概率 πi 趋近于 1 ，logit 将趋近于 +∞ 。因此，通过以上变换，logit 将概率 πi 的取值范围从 (0, 1) 映射至整个实数轴。显然，如果概率为 0.5，胜算比为 1，相应的 logit 为 0。logit 为负表示概率小于 0.5，反之则表示概率大于 0.5。图 15-1 说明了上述变换的对应关系。
Logistic 模型
在完成了上述变换后，我们就可以定义 Logistic 回归模型了，此时我们假设概率 πi 的 Logit 变换 (而非概率 πi 本身) 服从线性模型，即 logit(πi ) = ln πi 1 ? πi = xi β , (15-6)
其中，xi 为解释变量构成向量，β 为系数向量。
第十五章 LOGISTIC 模型
100 80 60 40 20 0 0 .2 .4 .6 Probability .8 1 Probability
1 .8 .6 .4 .2 0 ?4 ?2 0 Logit (log?odds) 2 4
感觉不错的话,微信扫一扫关注官方微信公众账号,以后找资料更方便
是互联网分享学习的开放平台，汇集亿份高价值的文档资料，涵盖档下载,程序开发文档,教育文档,医药文档,办公文档,考试文档,营销文档,工程文档,分享文档等行业。为您提供愉悦的分享学习体验。
连玉君_Logit模型STATA
你可以免费下载该文档
没满足你的要求? 查找更多相关内容君，已阅读到文档的结尾了呢~~
扫扫二维码，随身浏览文档
手机或平板扫扫即可继续访问
stata上机实验第六讲离散选择模型
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由：
将文档分享至：
分享完整地址
文档地址：
粘贴到BBS或博客
flash地址：
支持嵌入FLASH地址的网站使用
html代码：
&embed src='/DocinViewer-4.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布，请您等待！
3秒自动关闭窗口苹果/安卓/wp
积分 1299, 距离下一级还需 76 积分
权限: 自定义头衔, 签名中使用图片, 隐身
道具: 彩虹炫, 涂鸦板, 雷达卡, 热点灯, 金钱卡, 显身卡, 匿名卡, 抢沙发下一级可获得
权限: 设置帖子权限道具: 提升卡
购买后可立即获得
权限: 隐身
道具: 金钱卡, 彩虹炫, 雷达卡, 热点灯, 涂鸦板
开心签到天数: 28 天连续签到: 2 天[LV.4]偶尔看看III
多项logit模型好像默认的自变量都是连续变量吧，那么，如果自变量中有分类变量，用stata如何针对此变量设置参照组呢？求解，谢谢。
用tab var,gen(var)试试生成虚拟变量
载入中......
这世界笑了，于是你合群地一起笑了。。。
用tab var,gen(var)试试生成虚拟变量
本帖最后由 statalearning 于
10:55 编辑
还是看楼下的指导。
本帖最后由蓝色于
01:20 编辑
看帮助Factor variables的解释
& & [U] 11.4.3 Factor variables
Base levels
& & You can specify the base level of a factor variable by using the ib. operator.&&The syntax is
& && && &&&Base& && && &
& && && &&&operator(*)& & Description
& && && &&&---------------------------------------------------------------------------------------------------------
& && && &&&ib#.& && && &&&use # as base, #=value of variable
& && && &&&ib(##).& && &&&use the #th ordered value as base (**)
& && && &&&ib(first).& &&&use smallest value as base (the default)
& && && &&&ib(last).& && &use largest value as base
& && && &&&ib(freq).& && &use most frequent value as base
& && && &&&ibn.& && && &&&no base level
& && && &&&---------------------------------------------------------------------------------------------------------
& && && && &(*) The i may be omitted.&&For instance, you may type ib2.group or b2.group.
& && && &&&(**) For example, ib(#2). means to use the second value as the base.
& & If you want to use group==3 as the base in a regression, you can type,
& && &&&. regress y&&i.sex ib3.group
& & You can also permanently set the base levels of categorical variables by using the fvset command.
Selecting levels
& & You can select a range of levels -- a range of virtual variables -- by using the i(numlist). operator.
& && && &Examples& && && & Description
& && && &-----------------------------------------------------------------------------------------------------------
& && && &i2.cat& && && && &a single indicator for cat==2
& && && &2.cat& && && && & same as i2.cat
& && && &i(2 3 4).cat& && &three indicators, cat==2, cat==3, and cat==4;
& && && && && && && && && &&&same as i2.cat i3.cat i4.cat
& && && &i(2/4).cat& && &&&same as i(2 3 4).cat
& && && &2.cat#1.sex& && & a single indicator that is 1 when cat==2 and sex==1, and is 0 otherwise
& && && &i2.cat#i1.sex& &&&same as 2.cat#1.sex
& && && &-----------------------------------------------------------------------------------------------------------
Stata版版规
xi: 是专门生成分类变量dummy的命令，还用来生成分类变量和其它变量的交叉项，分类变量放在前面，比如 i.rep78*gear_ratio,
xi: regress mpg i.rep78
生成的变量有（每个都是判断变量，比如_Irep78_2 , 如果rep78==2，则回馈1，否则0）
_Irep78_2& && &
_Irep78_3& && &
_Irep78_4& && &
_Irep78_5&&
rep78==1的自动作为参照组，省去（omitted），为避免多重共线性，即变量间可以用线性关系表示。
这样，所有回归出的分类变量上的系数都是相对于参照组rep78==1而言的。
不爱其亲而爱他人者，谓之悖德；不敬其亲而敬他人者，谓之悖礼。——《孝经》
初级热心勋章
初级热心勋章
初级信用勋章
初级信用勋章
初级学术勋章
初级学术勋章
中级学术勋章
中级学术勋章
中级热心勋章
中级热心勋章
中级信用勋章
中级信用勋章
高级热心勋章
高级热心勋章
高级信用勋章
高级信用勋章
无限扩大经管职场人脉圈！每天抽选10位免费名额，现在就扫& 论坛VIP& 贵宾会员& 可免费加入
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
如有投资本站或合作意向，请联系（010-）；
邮箱：service@pinggu.org
投诉或不良信息处理：（010-）
京ICP证090565号
论坛法律顾问：王进律师下载作业帮安装包
扫二维码下载作业帮
1.75亿学生的选择
关于用stata做二元选择模型的步骤我要用stata软件做一个二元选择模型,是截面数据,本人计量经济学当初没有好好学习,现在非常非常后悔,不太清楚统计完指标做出模型以后该做哪些相关的检验,（请尽量详细,本人要做论文.
瑟瑟同学9夅q
statistics --> binary outcomes --> probit regression 在菜单的 dependent variable中选取你的0-1型变量（因变量）
independent variable 中选取你的自变量,运行即可
谢谢！这个我懂，我的意思是说，需要进行哪些检验？有特别严格的步骤吗？请您指点一二！
总体模型是否有意义，主要看显著性检验，这里是结果输出中 P>|z| 的值，如果小于0.05，就完全没问题；0.05~0.1变量的显著性不强，有时也可以凑合；如所有系数均>0.1，模型失败。
谢谢你哦！我刚开始选取了13个指标，结果只有3个指标的P>|Z|的值在0.1一下，剩下的指标还得调整，再请教一下：Pseudo R2就是模型的拟合优度R平方吗？
我第一次做出的结果显示如下：
LR chi2(13)
Prob > chi2
Log likelihood = -150.95043
请问这些数据各自代表什么，能说明什么呢？
Pseudo R2不是模R平方，但非常类似。对于微观计量模型来说，这几个指标都没多大意义，关键还是显著性检验。只要有一个自变量通过显著性检验，模型就算是有一定的合理性了。
为您推荐：
其他类似问题
扫描下载二维码}

叫阿莫西中心