发邮件向老师请教问题Treatment Effect Model的问题

请教Treatment Effect Model的问题_百度知道
请教Treatment Effect Model的问题
我有更好的答案
*y为因变量,x*是自变量,z为哑元,w*为自变量:
treatreg y x*, tr(z=w*) two
*等价于以下命令:
prob z w* predict gw, xb g lambda=normalden(gw)/normal(gw) if z replace lambda=-normalden(gw)/normal(-gw) if !z reg y 珐涪粹皇诔郝达酮惮捆x* z lambda
其他类似问题
为您推荐:
等待您来回答
下载知道APP
随时随地咨询
出门在外也不愁搞定Stata,论文发表不求人_经管之家论坛-爱微帮
&& &&& 搞定Stata,论文发表不求人
翻阅Top期刊上的论文,你会发现多数论文并没有使用非常复杂的方法,关键在于论文的想法或视角比较独特,并使用了恰当的方法来论证。这里的关键在于研究设计,而这在目前的计量教科书中鲜有涉及。为此,本次研讨班突出两个特点:一方面,我会努力把基础知识讲解透彻,进度上不求快;另一方面,我在每个专题中都会提供了2-3篇比较经典的论文,展示这些方法的合理应用。Stata特训_2015年7月暑假现场班迅速提升论文发表与Stata应用技能(暑期唯一一次Stata论文特训)在内容的安排上,基本上遵循了由浅入深,循序渐进的思路。第1-4讲依序介绍stata的基本用法、数据处理、程序编写和线性回归分析。学习这些内容无需太多的计量经济学基础。第5-7讲的内容在难度上有所提高,包括:内生性问题的处理方法(IV-GMM和倍分法);时间序列模拟分析和时序特征;面板数据(Panel Data)模型。讲师介绍
连玉君,经济学博士,副教授。2007年7月毕业于西安交通大学金禾经济研究中心,现任教于中山大学岭南学院金融系。主讲课程为“金融计量”、“计量分析与Stata应用”、“实证金融”等。已在《经济研究》、《管理世界》、《经济学(季刊)》、《金融研究》、《统计研究》等期刊发表论文50余篇。连玉君副教授主持国家自然科学基金项目、教育部人文社科基金项目、广东自然科学基金项目各一项,并参与了多项国家自科和社科基金项目的研究工作。目前已完成Panel VAR、Panel Threshold、Two-tier Stochastic Frontier等计量模型的Stata实现程序,并编写过几十个小程序,如xtbalance、bdiff、hausmanxt、ttable3、hhi5等。Stata初级班课程大纲专题名称授课内容
第1讲(3小时)Stata简介数据的导入和导出执行指令和基本统计分析do文件和log文件的使用帮助文件的使用和外部命令的获取一篇范例文档
第2讲(3小时)数据处理数据的横向合并和纵向追加重复样本值、缺漏值和离群值的处理基本统计量的呈现基本统计分析(组间均值差异和中位数差异检验)文字变量的处理大型数据的处理范例(GTA数据库和工业企业数据库)
第3讲(3小时)Stata程序局域暂元和全局暂元(local, global)控制语句(条件语句、循环语句)Stata中的各类函数分组回归分析范例:盈余管理程度的估算、现金持有调整系数的估算
第4讲(3小时)模型的设定和解释线性回归模型回顾(OLS)虚拟变量和交乘项的使用及解释R2分解和贡献度分析分组回归和组间系数差异检验Bootstrap、Jackknife及稳健性标准误的获取估计结果的呈现和分析
第5讲(3小时)内生性问题及估计方法工具变量法(IV)广义矩估计法(GMM)简介倍分法(Difference in Difference)应用实例(介绍3篇论文)
第6讲(3小时)时间序列模拟分析时间序列简介ARIMA过程模拟分析白噪声和随机游走过程模拟分析伪回归问题模拟分析GARCH模型模拟分析
第7讲(3小时)面板数据模型静态面板模型:固定效应和随机效应基于Bootstrap的Hausman检验异方差和序列相关(Bootstrap、Cluster调整标准误)包含内生变量的固定效应模型实证分析中的常见问题应用实例(介绍3篇论文)
第8讲(3小时)论文写作与发表专题Endnote和Google Scholar的使用论文的选题如何梳理和评述文献研究贡献的陈述研究设计与论文的修改修改报告的撰写 (与审稿人有效沟通)Stata高级课程导引Stata高级班包括8个专题,主要涉及如下几个方面的内容:(1)面板模型:动态面板模型、面板VAR模型和面板门槛模型(第1讲和第3讲),作为基础,在第2讲中,将介绍Bootstrap和Monte Carlo模拟相关的知识;(2)内生性问题,包括处理效应模型和倾向得分匹配分析两类模型(第5讲),作为这一讲的基础,在第4讲中,将介绍Logit模型;(3)随机边界分析相关的模型:传统的SFA模型、异质性SFA模型、面板SFA模型,以及双边SFA模型(第6讲);(4)计数模型(第7讲):被解释变量为计数变量,如专利个数、违章次数、被证监会批评的次数等;(5)结构方程模型(第8讲):重点介绍路径分析和中介效应,以及如何采用图形界面高效地进行结构方程模型估计和检验。Stata高级课程大纲专题名称授课内容第1讲(3小时)动态面板模型面板VAR模型一阶差分GMM估计量(FD-GMM)序列相关检验和过度识别检验(Sargan检验)面板VAR模型简介冲击反应函数 (IRF)、方差分解 (FEVD)应用实例(介绍3篇论文)
第2讲(3小时)自抽样和蒙特卡洛模拟Bootstrap的原理和Stata实现Bootstrap组间系数差异检验Bootstrap获取复杂统计量的临界值Monte Carlo的基本原理Monte Carlo应用实例:内生性偏误的后果第3讲(3小时)面板门槛截面门槛模型(Cross-sectional Threshold Model)面板门槛模型(Panel Threshold Model)应用实例(介绍2篇论文)
第4讲(3小时)Logit模型Logit模型简介模型设定、估计方法和结果的解释多元Logit模型(Multinomial Logit)应用实例(介绍3篇论文)
第5讲(3小时)内生性问题Heckman选择模型(Heckman Selection Model)处理效应模型(Treatment Effect Model)倾向得分匹配分析(Propensity Score Matching, PSM)应用实例(介绍2篇论文)
第6讲(3小时)随机边界分析(SFA)SFA的模型设定和估计方法异质性SFA模型(Heterogeneity SFA)面板SFA模型(Panel Data SFA)双边SFA模型(Two-tier SFA)应用范例(介绍3篇论文)第7讲(3小时)计数模型(Count Data model)计数模型简介及应用Poisson回归模型负二项回归模型应用实例(介绍2篇论文)
第8讲(3小时)结构方程模型简介(SEM)SEM简介、SEM的分析流程使用SEM估计传统线性回归模型SEM的图形界面分析(SEM Builder, GUI)验证性因子分析(CPA)路径分析与中介效应(Path analysis)直接效应、间接效应和总效应时间:初级-6日 (四天) 高级-11日(四天)地点:北京市海淀区首都体育学院安排:上午9:00-12:00;下午2:00-5:00;答疑5:00-5:30费用:基础:3600元 / 2600元 (凭学生证优惠价) 高级:4000元 / 3000元 (凭学生证优惠价)全程:6200元 / 5000元 (凭学生证优惠价)我要报名:http://www.peixun.net/view/307_join.html优惠信息:1. 无论报初级班还是高级班,缴费成功后都享受如下优惠:√ (a)赠送与所报课程相同的stata视频教程,即报初级班送初级班视频,报高级班送高级班视频,报全程送初级和高级视频;√ (b)5折优惠购买Stata学术论文视频;2. 现场班老学员9折优惠;3. 同一单位3人以上同时报名9折优惠; 同一单位6人以上同时报名8折优惠;4. 优惠2和3不同时适用;5. 根据报名缴费顺序安排现场座位。报名流程:1. 打开“我要报名”后面的链接页面,网上提交报名信息;PS:报名时请注明是全程还是初级,高级~2. 电话确认,缴费:http://baoming.pinggu.org/paycenter.aspx;3. 缴费确认,开课前一周发送软件准备,电子版讲义;4. 现场领取发票及邀请函。联系方式:魏老师QQ:Tel:010-Mail:vip@pinggu.org
点击展开全文
悄悄告诉你
更多同类文章
还可知道有多少人阅读过此篇文章哦
阅读原文和更多同类文章
可微信扫描右侧二维码关注后
还可知道有多少人阅读过此篇文章哦
经管之家官微,每个经济、管理、金融、统计的学习和从业者,都应该有的帐号。经管之家(论坛),是国内成立十年的大型经济、金融、管理、计量统计社区,十年磨一剑,我们共同的家园!我们提供“经管爱问”答疑微服务,以及相关数据分析及金融培训课程。
您的【关注和订阅】是作者不断前行的动力
本站文章来自网友的提交收录,如需删除可进入
删除,或发送邮件到 bang@ 联系我们,
(C)2014&&版权所有&&&|&&&
京ICP备号-2&&&&京公网安备34TOP热门关键词
专题页面精选
在Stata课堂有很多学员的提问很具有代表性,老师给予了详细精彩的回答,现计划把一些典型问题+讲师解答汇总作为一个系列帖子发布出来,持续更新,希望对大家有帮助Q1.Stata12的绿色版本下载A:从这里(http://bbs.pin ...
在Stata课堂有很多学员的提问很具有代表性,老师给予了详细精彩的回答,现计划把一些典型问题+讲师解答汇总作为一个系列帖子发布出来,持续更新,希望对大家有帮助Q1. Stata12的绿色版本下载A: 从这里()下载了Stata12的绿色版本,除了不能在线更新外,别的功能都很正常。Q2. Stata12 的 Manual:(Stata12电子手册)下载:
A:从这里(
)下载Stata12 的 Manual:(Stata12电子手册)
Q3. A: 下载了软件Stata12软件和Stata12 的 Manual:(Stata12电子手册)后,为了能从stata12内部直接连接到PDF电子手册,需要作如下设定。
处理方法:
1. 将上述连接中提供的doc1.rar和doc2.rar下载到硬盘上,解压后将PDF文档放置于 D:\stata12\docs 目录中;
2. 更改PDF文件的名称,以便Stata12的帮助文件能够直接识别这些PDF文件,更名方法如下: 更改后的文件名
提供的文件名
STATA DATA-MANAGEMENT REFERENCE MANUAL RELEASE 12
STATA GRAPHICS REFERENCE MANUAL RELEASE 12
GETTING STARTED WITH STATA FOR WINDOWS RELEASE 12
STATA QUICK REFERENCE AND INDEX RELEASE 12
Stata Release 12 Installation Guide
MATA REFERENCE MANUAL RELEASE 12
STATA MULTIPLE IMPUTATION REFERENCE MANUAL RELEASE 12
STATA MULTIVARIATE STATISTICS REFERENCE MANUAL RELEASE 12
STATA PROGRAMMING REFERENCE MANUAL RELEASE 12
STATA BASE REFERENCE MANUAL RELEASE 12
STATA SEM REFERENCE MANUAL RELEASE 12
STATA SURVIVAL ANALYSIS AND EPIDEMIOLOGICAL TABLES REFERENCEMANUAL RELEASE 12
Combined subject table of contents
STATA SURVEY DATA REFERENCE MANUAL RELEASE 12
STATA TIME SERIES REFERENCE MANUAL RELEASE 12
STATA USER’S GUIDE RELEASE 12
STATA LONGITUDINAL DATA PANEL DATA REFERENCE MANUAL RELEASE 12
完成更名后的效果如下:
完成上述设定后,在Stata12命令窗口中输入:
help regress
点击帮助文件中 Title 下方的蓝色链接 [R] regress,即可打开相应的 PDF 电子说明书。
A:这里是针对英文的windowsxp操作系统。有时候遇到英文操作系统下stata的结果中汉字拷贝会出现乱码的情况,下面是解决方法。英文操作系统完美支持中文的方法不用担心,除了界面是英文的,其他使用上与中文版的没什么区别,设置好以下几处
就好了: 都在windows的(控制面板)Control Panel -& Regional and Language Options中1.在Language页中选上Install files for East Asian Languages, 点Apply。
2.Regional Options页上,将Standards and formats选为China(PRC), Location
选为China。
3.Advanced页上,将Language for non-Unicode programs选为Chinese(PRC)
4.重启计算机
5.再在Language页中点击Text service andinput languages的“Detail”,将
Chinese(PRC)-Chinese(Simplified)-US Keyboard设置为默认输入法,再添加你喜欢
的输入法。其中1,3,5是重要的步骤。如果没有3,绝大部分中文程序都会显示乱码,如果
没有5,在不同程序间拷贝中文就会变成乱码。
这些数字考进stata后
全部变成了科学计数法这种了:
求助老师了,怎么样把这个科学计数法变回原来的数字呢?原来的数字(像这种)可以唯一识别每个观察值,科学计数法则很多观察值都一样了!求助!
1、在excel里这个数字是用“文本”格式存储的,我就直接从excel往stata里考,考的全都是科学计数法;
2、老师说的xml格式无论如何搞不成;
3、存成csv格式然后insheetusing也还是科学计数法。
请老师指点啊!
A:formatx %20.0f
A:sysuseauto,clear
*-删除所有观察值缺失的变量(不包括文字变量)
foreachv of varlist _all{
localvtype: type `v'
*dis&`vtype'&
localyesstr = strmatch(&`vtype'&,&str*&)
*dis`yesstr'
quisum `v'
if`r(N)'==0&`yesstr'==0{
*-取出变量的标签helpextended_fcn
localvlabel: var labelmake
dis&`vlabel'&
*-取出 abcd 与 bcde 的交集
*settrace on
locala &abcd&
localna = length(&`a'&)
localb &bcde&
localmatch && // 存放结果
forvaluesi = 1/`na'{
local a_i = substr(&`a'&,`i',1)
ifstrpos(&`b'&,&`a_i'&)&=1{
local match&`match'&&`a_i'&
dis&`match'&
Q7:我在用倾向得分匹配方法做某一问题研究时,结果发现OLS对差距的T检验非常显著,而PSM却非常不显著,这能说明什么问题呢?处理效应
处理组(补贴组)
对照组(非补贴组)
A:PSM有两个重要的假设是 OLS 没有考虑的。
一个是共同支撑假设,common support,说的是两组在整体上要有相似的特征。
另一个是平行假设,balancingassumption,说的是两组样本在各个维度上应该相似。
假设有四个人,高考分数如下:
* Q2: 上北大(PK)能获得更高的收入吗?
*----------------------------------------------
语文数学英语物理化学
毕业当年年薪
*----------------------------------------------
* Stu PK: 120 138 130 0
*----------------------------------------------
* Stu C1: 110 118 125 0
* Stu C2:95 150
* Stu C3: 119 132 135 8
*----------------------------------------------
如果想研究上北大是否能获得更好的收入,通常的做法就是用Stu PK 的收入和其他人比。但实际上我们想要的是“Stu PK 上北大的收入 - 假如 Stu PK 不上北大的收入”。问题在于,“假如 Stu PK 不上北大的收入”是不可观测的,因为“人不能两次踏入同一条河流”。
OLS 回归是把四个人都放进来回归,其实就是比Stu PK 与其他三个人的收入之差异。你的结论很可能是上北大能获得更高的收入。但是,这个结果是有偏的!原因如下:
其一,Stu C1 本身与Stu PK 不具可比性,他的分数只有 580 分,这不满足 CommonSupport;
其二,Stu C2 虽然与Stu PK 的总分相同,但是他们在单科成绩上差别很大,这不满足Balancing Assumption;
正确的做法其实是用 Stu PK 与 Stu C3 作比较,二者在各方面都非常接近,唯一的差异就是一个上了北大,一个没上(这个人的收入可以大体替代前面想要的那个不可观测的东西——“假如 Stu PK 不上北大的收入”),即,12.0-11.5 = 0.5 才是“上北大”这个 Treatment 的真正效果,这就是 PSM 分析的核心思想。
换句话讲,OLS 虽然放了很多控制变量,并声称“在控制了其他变量的情况下,x 变动一单位对 y 的影响……”,但是其实上它只是摆了一个Pose,并不能真正实现这一目标。PSM 做到了!
Q8:如何做propensityscore matching?
比如,.psmatch2training age gender, out(wage)然后呢?STATA的网站上好象并没有给出如何interpret 运行结果或者接下来应该怎么做。是不是把得到的propensity score作为一个regressor 带到原模型里面再回归呢, 如.logit wagetraining age gender _pscore
A:下面是个简单的例子。* -psmatch2- 命令
global x &size levprof tobin gpay hhi5&
global xv &_Isicmen* _Igfinal*&
global if56 &if year==2005|year==2006&
*- 比较各变量匹配前后的情况
*- 最近邻匹配
cap drop u
gen u = uniform()
psmatch2 jili $x $xv $if56,neighbor(3)logit
order id year jili _pscore- _pdif
*- 匹配前后解释变量的差异对比
pstest $x, sum*===============================
-ATT- 比较
*===============================* xx 里包含了带比较的outcome变量。
global xx &roe2 roa cash ac invt salegr tagr&
*- 基本统计量
tabstat $xx if year&2004,///
stat(mean sd p50 min max)format(%6.3f) c(s)
Q9、请问动态面板数据分析中需要考虑异方差问题吗?我看一些发表的文章中对动态面板数据的分析也很少提及异方差问题。如果需要考虑,我怎么检验呢?又怎么解决呢?
A: 动态面板采用 GMM 估计时,可以附加 robust 选项获得考虑异方差后的稳健性标准误。至于检验问题,其实并不重要。在多数研究中,使用的都是大 N 小 T 型面板数据,此时异方差基本上是必然存在的。理论文献中也基本上很少涉及这方面的检验。
Q10、在静态面板的分析中,您专门分析了异方差问题,但是针对组间异方差检验,也就是针对每个截面;您说前面的固定效应中分析的异方差是针对个体的。那么,针对截面的异方差和针对个体的异方差,检验方法有何差异呢?我们在实证分析中都需要考虑吗?如果需要,怎么检验以及解决?
A: 在 Panel 分析中,通常所谓的个体(individual)其实就是指截面。因此,虽然我在视频中表述不同,但其实涉及的都是同一个问题。在 FE 估计中,文献中基本上是假设存在异方差,直接报告 robust 标准误,很少有人执行相关的检验,原因与第一个问题的回答相似。
Q11:我的数据包括N和T差不多的情况及大T小N的情况。
这种两种情况下,我该用什么命令估计动态面板呢?您讲义中就提了一种适用大T小N的命令xtlsdvc,但其前提太严格(所有解释变量都严格外生),我的数据显然不符合,我数据中的解释变量基本都是内生变量。
A:仍然用课程中介绍的方法进行估计,文献中对于 N 和 T 的大小并没有严格的界定。不过,在这种数据中,工具变量的选择很关键,因为T 比较大,如果按照 xtabond 自己选择的结果,则 L(2/.)y 都会作为工具变量,其中会包含很多很差的工具变量,如 L10.y, L11.y 等等。此时,要采用 help xtabond 命令中的 maxlags(#) 选项来限制工具变量的个数。如maxlags(5),那么就只用 L(2/5).y 作为工具变量,可以有效克服 T 较大时自由选择工具变量导致的弱工具变量问题。
A:webuseinvest2
. xtrcinvest market stock
Random-coefficientsregression
Number of obs
Groupvariable: company
Number ofgroups=
Obs per group: min =
Wald chi2(2) = 17.55
Prob & chi2
------------------------------------------------------------------------------
Coef.Std.Err.
P&|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
market | . 0.001
stock | . 0.000
_cons |-23.47 -0.68 0.495
------------------------------------------------------------------------------
Testof parameter constancy:
chi2(12) =603.99
Prob & chi2 = 0.0000最后一行的信息表明系数为常数的原假设被拒绝了。表明需要采用变系数模型。至于变截距模型,其实就是在PooledOLS 基础上增加了N-1个虚拟变量,它所研究的问题与xtrc存在一定的差异。由于两个模型不是嵌套的(nestedineach other),我还真不清楚还如何检验何者更为合适。
Q13. GMM中的hansen检验和sangan检验可以相互替代吗?两者有什么区别?
A:help xtabond2
下面这段话说的很清楚:
xtabond2 also reports tests of over-identifying restrictions--ofwhethertheinstruments, as a group, appearexogenous.Forone-step, non-robust estimation, it reports the Sarganstatistic, which is theminimized value of the one-step GMM criterionfunction.The Sarganstatistic is not robust to heteroskedasticity orautocorellation.Sofor one-step, robust estimation (and for alltwo-step estimation), xtabond2also reports the Hansen J statistic, which is theminimized value of thetwo-step GMM criterion function, and is robust. xtabond2still reports theSargan statistic in these cases because the J test has its ownproblem: it canbe greatly weakened by instrument proliferation.
Q14.stata怎么输出ttest等参数检验结果或者一些非参数检验的结果到word吗,就像输出表格或者回归结果到word或者excel中那样!A:ret list
然后把这里的返回值写入矩阵,再用logout 输出即可。
Q15. 我在用stata做时间序列分析的时候,用tsset date定义时间变量,结果出现了如下错误提示
repeated time values in sample
如果我继续做DF检验的话,就会出现如下错误:
. dfullerln_szzs
time variable not set, use -tssetvarname ...-
不知为何, 期盼您的指点。
A:既然是时间学列,就要求 year 变量能够唯一识别每一个观察值。
那个错误提示是说你的样本中某个年度的观察值可能出现了两次以上,比如,2003 年的观察值可能被重复记录了两次。
可以采用如下命令删除重复值:
duplicates drop year, force
然后,再执行 tsset 命令即可:
tsset year
Q16. PSM、DID、Treatmenteffect model有什么区别呢?我应该如何选择模型呢?
比如,对于0、1内生变量,我选择PSM或Treatmenteffect model,而对于一个能够同时产生时间维度和企业层面维度的事件,我们选择DID,这样理解对吗?谢谢A:Treatment effect model 主要针对解释变量中包含 0/1 虚拟变量的类型。这通常都源于自选择问题。例如,研究上北大是否有助于提高收入这个问题,上北大与否就是一个虚拟变量 Dum_PK。但问题在于,能上北大的学生本身就是好学生,这些人有较强的能力,即使不上北大,收入仍然可能高于其他同学。此时 Dum_PK 便是一个内生变量。具体而言,模型设定如下:
Income = a + b1*Control_Variables + b2*Dum_PK + e
在这个模型设定中,干扰项 e 中可能会包括一些无法观测的因素,如“能力”。显然,能力与 Dum_PK 是相关的,也就是说,在上述模型设定中,Corr(Dum_PK, e) != 0,即所谓的内生性问题。
此时便需要采用 Treatmenteffect model,基本思想是找到合适的工具变量。stata 命令为 treatreg。
PSM 也可以解决这里提到的内生性问题。基本思路是,找到一些与北大学生各方面特征都相似但没有上北大的同学(他们的能力应该与北大学生相似),用他们的收入来衡量北大学生如果不上北大时的收入。两组人的主要差别仅限于是否上了北大,其他特征相似。
DID 要处理的问题更复杂一些。涉及到时间因素与 Treat 效应的分离问题。例如,广州 2009 年开始限房价,我们想在 2011 年的时候评估限价的效果。然而,在
年期间,假设广州的均价从 15000 涨到了 20000,但二者相差的 5000 块并不能完全归因为限价,因为随着时间的推移,经济在增长,这本身就会促使房价上涨。问题的核心就在于,如何把经济增长导致的房价变化,与限价政策导致的房价变化分离开。
此时可以采用 DID,基本想法是找到一个没有被限价,但各方面特征于广洲相似的城市,用这个城市的房价变动衡量广州房价随时间自然增长的部分,剩下的部分可以归结为限价政策的效果。
但是,想找到一个与广州相似的配对城市并不容易,此时可以采用 PSM。因此,PSM 往往可以与DID 联合使用。
DID 的基本思想图示如下:
*----------------------------------
*----------------------------------
时间效应+处理效应
* Control |
时间效应+0
*----------------------------------
(Y1-Y0)-(C1-C0)
Q17. HeckmanModel 与Treatment effect Model 在技术层面有什么差异呢?或者说它们两者的适用条件有什么不同?A: *--------
*-4.4.2.1Heckman 模型设定
help heckman
shellout Refs\Stata_Heckman.pdf//Bookmark: Themodel
*-Regression equation:
y = xb + u_1
*-Selection equation:
Z is varlist_s
y observed ifZg + u_2&0 (根据 y 是否缺漏确定 1/0 变量)
u_1 ~ N(0,sigma^2)
u_2 ~ N(0, 1)
corr(u_1,u_2) = rho
*-4.4.2.2Heckman 模型估计方法
*-最大似然估计 (MaxlikelihoodEstimation, MLE)
*-基于二元联合正态分布函数
*-两步法 (Two-stepEstimation)
*-Step1: Probit (Treat Equation)--&Prob(Z=1)
Pr(y_jobserved | z_j) = norm(zg)
inverseMill's ratio: m = normden(wb)/norm(wb)
*-Step2: reg y xm//regression Equation 中加入 hazard
*-------------------
*-4.4.3处理效应模型TreatmentEffect Model
*-4.4.3.1模型设定
help treatreg // Also see | Manual: [R]treatreg
shelloutRefs\Stata_Treatreg.pdf
*-Primary regression equation:
y_j = X_j*b1+Z_j*b2 + e_j (1)e_j~N(0,sigma^2)
*-Treatment equation
Z_j* =W_j*gamma +u_j
(2)Latentvariable
u_j~N(0,1)
*-Decision rule:
{ 1if (Z_j*&0)
Note:Z_j 是可以观察到的
{ 0otherwise
* Corr(e_j, u_j) = rho//内生性的根源
*------------------------
*-与 Heckman model的差异
*- yis[fully]observed in Treat model
*- y is[partly]observed in Heckman model
*- D may existornot in Heckman model, but must be there in Treat model
*inHeckman: the Probit estimation aims to observe Y*
0/1 is based on whether y is observed
*inTreat: the Probit estimation aims to observe Z*
0/1 is based on whether the individual is treated
Q18. 我采用xmluse命令直接导入excel中的数据到stata11中,但是中文字符出现乱码无法显示,请问老师怎样解决上述问题?
我尝试了以下几种解决方法,问题并未得到解决:
1.将office2013软件更换为office2007;
2.标准化文本、数据格式;
但是我采用以下方法,stata11中文字字符却并未出现乱码:
1.先将excel另存为文本文件(以制表符分隔),用insheetusing命令将文本文件直接导入stata;
2.复制粘贴的方法;
stata11的工作环境:win8;office2013.
A:那就用第二种方法吧。
如果你使用stata 12 软件的话,可以直接从 Excel 中导入数据。
Q19. 请问面板数据分析中对模型的解释,应该用组间(R-squared between),还是R-squared overall呢?
A: 对于 FE 模型,xtreg,fe 估计后应该采用 within-R2.
至于RE模型,则可以采用overall-R2.
Q20:MLE过程中,参数 row 的取值范围是 0-1,而theta 必须为正,但是如何设置参数的取值范围呢?
A:写程序时,可以设定 theta = ln(theta2),得到theta2 的估计值后可以求出 theta = exp(theta2)。
同理,可以设定row = normal(row2),得到 row2 的估计值后,可以求出 row = invnormal(row2)。
Q21. data菜单下面combinedatas,有两个:merge two datasets和from allpairwise combinations from groups有什么区别?A: help merge
help joinby
Q22. 已有上市公司年月日的一栏数据,想生成一栏年份数据与一栏月份数据,应该如何生成A:这里有个例子可以看一下
*-eg02:年月日的分离
use tostring2.dta, clear
tostring date_pub, gen(date1)
gen year= substr(date1, 1, 4)
gen month = substr(date1, 5, 2)
gen day = substr(date1, 7, 2)
destring year month day, replace
Q23.有缺漏值的那一行观察值不参与回归,为什么还要单独删除缺漏值呢?这样和直接回归不对缺漏值进行处理的操作有什么区别呢?谢谢A: 很多论文中会同时报告多种模型设定下的结果,预先删除缺漏值可以保证各个模型中使用的样本数相同,使模型之间具有可比性。 Q24.在输出结果是应当怎样设置,可以让回归结果的系数,不是科学计数法的形式。如:-1.9e+04***A: 系数的大小与你的量纲有关系,如果把你的解释变量乘以100000,则回归系数应为1.9……。这不会影响标准误的计算。 Q.25.国泰安数据库中行业代码中每个行业都明细的话有几十个,怎样形成只包括制造业明细分类,而其他行业用一级分类的代码共22个行业代码呢?(是不是把行业代码改为数值型,再用replace命令呢?)
这样在后面生成虚拟变量时,可以用 以下进行处理
tabinds,gen(dum_r)
drop dum_r1
A: *-行业划分(制造业细分到次类,其他行业采用门类)
*-定义行业分类方法
*-参见 黄梅,夏新平(2009)南开管理评论
clonevar sic2 = sicda_str // 行业大类码
order id year sic2
replace sic2 = substr(sic2,1,1) if substr(sic2,1,1)!=&C&
replace sic2 = substr(sic2,1,2) if substr(sic2,1,1)==&C&
replace sic2 = &C9& ifsic2==&C2&// 将 C2 并入 C9
*-每年度每个行业至少保留 15 家公司
bysort sic2 year: egen num_sic_year = count(id)
keep if num_sic_year &=15// Roychowdhury(2006,p.349)
本文关键词: 本文论坛网址:
您可能感兴趣的文章
本站推荐的文章
本文标题:
本文链接网址:
1.凡人大经济论坛-经管之家转载的文章,均出自其它媒体或其他官网介绍,目的在于传递更多的信息,并不代表本站赞同其观点和其真实性负责;
2.转载的文章仅代表原创作者观点,与本站无关。其原创性以及文中陈述文字和内容未经本站证实,本站对该文以及其中全部或者部分内容、文字的真实性、完整性、及时性,不作出任何保证或承若;
3.如本站转载稿涉及版权等问题,请作者及时联系本站,我们会及时处理。
加入经管之家,拥有更多权限。}

我要回帖

更多关于 请教问题的英文邮件 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信