如何区分纯粹的自相关检验和模型形式误差产生的自相关检验。

第六章 自相关性6.1 自相关性:6.1.1. 非自相关假定 由第 2 章知回归模型的假定条件之一是, Cov(ui, uj ) = E(ui uj) = 0, (i, j ? T, i ? j), (6.1)即误差项 ut 的取值在时间上是相互无关的。称误差项 ut 非自相关。如果 Cov (ui , uj ) ? 0, (i ? j) 则称
误差项 ut 存在自相关。 自相关又称序列相关。原指一随机变量在时间上与其滞后项之间的相关。这里主 要是指回归模型中随机误差项 ut 与其滞后项的相关关系。 自相关也是相关关系的一种。 6.1.2.一阶自相关 自相关按形式可分为两类。 (1) 一阶自回归形式 当误差项 ut 只与其滞后一期值有关时,即 ut = f (ut - 1) + vt 称 ut 具有一阶自回归形式。 (2) 高阶自回归形式 当误差项 ut 的本期值不仅与其前一期值有关, 而且与其前若干期的值都有关系时, 即 ut = f (ut C 1, u t C 2 , …u t C p ) + vt 则称 ut 具有 P 阶自回归形式。 通常假定误差项的自相关是线性的。因计量经济模型中自相关的最常见形式是一 阶自回归形式,所以下面重点讨论误差项的线性一阶自回归形式,即 ut = ?1 ut -1 + vt 其中?1 是自回归系数,vt 是随机误差项。vt 满足通常假设 E(vt ) = 0, t = 1, 2 …, T, t = 1, 2 …, T,1(6.2)Var(vt) = ?v2, Cov(vi, vj ) = 0,i ? j,i, j = 1, 2 …, T,Cov(ut-1, vt) = 0, t = 1, 2 …, T, 依据普通最小二乘法公式,模型(6.2)中 ?1 的估计公式是,? a1 =? u t u t ?1t ?2 TT? u t ?1t ?2? ( ?1 =2? ( y t ? y )(xt ? x ) ) ? ( xt ? x ) 2(6.3)其中 T 是样本容量。若把 ut, u t-1 看作两个变量,则它们的相关系数是? ?=T t ?2? u t u t ?1t ?2T(r =T 2 t ?2? u t ? u t ?12?t ?1 ( yt ? y)(xt ? x ) T T ?t ?1 ( yt ? y)2 ?t ?1 ( xt ? x )2T)(6.4)对于大样本显然有? ut 2t ?2T? ? u t ?1 2t ?2T(6.5)把上关系式代入(1.4)式得? ?? u t u t ?1≈t ?2 TT=u t ?12?t ?2? a1(6.6)因而对于总体参数有 ? = ?1,即一阶自回归形式的自回归系数等于该二个变量的相关 系数。因此原回归模型中误差项 ut 的一阶自回归形式(见模型(6.2) )可表示为, ut = ? ut-1 + vt. (6.7)? 的取值范围是 [-1,1]。当 ? ? 0 时,称 ut 存在正自相关;当 ? ? 0 时,称 ut 存在负自相关。当 ? = 0 时,称 ut 不存在自相关。图 1.1 a, c, e, 分别给出具有正自相关, 负自相关和非自相关的三个序列。 为便于理解时间序列的正负自相关特征, 1.1 b, d, 图 f, 分别给出图 1.1 a, c, e, 中变量对其一阶滞后变量的散点图。正负自相关以及非自相 关性展现的更为明了。2 3 U 24 U 21 0 -10-2-2 -3 10 20 30 40 50 60 70 80 90 100-4 -4 -2 0 2U (-1) 4a. 非自相关的序列图4 Xb. 非自相关的散点图6 X 42200 -2-2-4-4 10 20 30 40 50 60 70 80 90 100-6 -6 -4 -2 0 2X(-1) 4 6c. 正自相关的序列图6 X 4 2 0 -2 -4 -6 10 20 30 40 50 60 70 80 90 100d. 正自相关的散点图6 X 4 2 0 -2 -4 X(-1) -6 -6 -4 -2 0 2 4 6e. 负自相关的序列图f. 负自相关的散点图图 1.1 时间序列及其自相关散点图 下面推导当误差项 ut 为一阶自回归形式时,ut 的期望、方差与协方差公式。由上 式有 E(ut) = E(? ut -1 + vt) = ? E(ut -1) + E(vt) 因为对于平稳序列有 E(ut) = E(ut -1),整理上式得 E(ut) =E (vt ) = 0. 1? ?(6.8)(6.9)Var(ut) = E(ut)2 = E(? ut -1 + vt)2 = E(?2 ut C12 + vt2 + 2? ut -1 vt ) = ?2 Var(ut-1) +?v2 整理上式得3 Var(ut) = ?u2 =? v2 1? ? 2(6.10)Cov(ut, ut-1) = E(ut ut-1) = E((? ut -1 + vt) ut-1) = ? Var(ut-1) = ? Var(ut) = ??u2 ut=? ut -1 + vt=?(? ut -2 + vt-1) + vt= ? 2ut ?2 ? ? vt ?1 ? vt = ? 2 ( ? ut ?3 ? vt ?2 ) ? ? vt ?1 ? vt = ? 3ut ?3 ? ? 2vt ?2 ? ? vt ?1 ? vt = ? = ? s ut ? s ? ? s ?1vt ? s ?1 ? ? ? ? vt ?1 ? vt 所以:Cov(ut, ut-s)=E((ut ut-s)= E ?( ? s ut ? s ? ? s ?1vt ? s ?1 ? ? ? ? vt ?1 ? vt )ut ? s ? ? ? = E ? ? s ut ? s ut ? s ? ? s ?1vt ? s ?1ut ? s ? ? ? ? vt ?1ut ? s ? vt ut ? s ? ? ? = E ? ? s ut ? s ut ? s ? ? E ? ? s ?1vt ? s ?1ut ? s ? ? ? ? E ? ? vt ?1ut ? s ? ? E ? vt ut ? s ? = ? s Var(ut-s) = ? s ?u2, (s ? 0 ) 令 u = (u1 u2 u3 … uT)’, (6.11)则由公式(1.9)(1.10)(1.11)得 , ,? 1 ? ? ? ? . ? T ?1 ?? ??1 .E(u u’ ) = ? = ?u2?2 ?.? T ?2? T ?3... ? T ?1 ? ? ... ? T ? 2 ? . . ? ? ... 1 ? ?(6.12)其中?u2 =? v2 。 1? ? 2从而验证了当回归模型的误差项 ut 存在一阶自回归形式时,Cov(ui, uj) ? 0。同理 也可证明当 ut 存在高阶自回归形式时,仍有 Cov(ui, uj) ? 0。 注意, (1)经济问题中的自相关主要表现为正自相关(原因见 3 节) 。 (2)自相关主要针对时间序列数据。6.2 自相关的来源与后果6.2.1 自相关性的来源 误差项存在自相关,主要有如下几个原因。 (1) 模型的数学形式不妥。若所用的数学模型与变量间的真实关系不一致,误差 项常表现出自相关。比如平均成本与产量呈抛物线关系,当用线性回归模型拟合时, 误差项必存在自相关。4 8 0 0 6 0 0 4 0 0 2 0 0 0 - 2 0 0 - 4 0 0 - 6 0 0 - 8 0 0 82 RESID 84 86 88 90 92 94 96 9810000 GDP1 5 0 0 1 0 0 080005 0 0 06000- 5 0 0 - 1 0 0 0 - 1 5 0 04000FDI
200 300 400 500- 2 0 0 0 82RESID 84 86 88 90 92 94 96 98(2) 惯性。大多数经济时间序列都存在自相关。其本期值往往受滞后值影响。突 出特征就是惯性与低灵敏度。如国民生产总值,固定资产投资,国民消费,物价指数 等随时间缓慢地变化,从而建立模型时导致误差项自相关。 (3) 回归模型中略去了带有自相关的重要解释变量。若丢掉了应该列入模型的带 有自相关的重要解释变量,那么它的影响必然归并到误差项 ut 中,从而使误差项呈现 自相关。当然略去多个带有自相关的解释变量,也许因互相抵消并不使误差项呈现自 相关。 (4)一些随机因素的干扰或影响引起随机误差项的自相关。如战争、自然灾害、 政策制定的错误后果、金融危机等,这些随机因素的影响可能会延续若干时期,从而 造成自相关。 (5)观测数据的处理。为了弥补缺失的数据或处理特殊的数据,往往需要对原数 据进行内插或平滑,处理的结果,可能会造成自相关。 6.2.2 自相关的后果 当误差项 ut 存在自相关时,模型参数的最小二乘估计量具有如下特性。 (1) 只要假定条件 Cov(X ' u) = 0 成立,回归系数 ?? 仍具有无偏性。 E( ?? ) = E[ (X 'X )-1 X 'Y ] = E[ (X 'X )-1 X ' (X ? + u) ]. = ? + (X 'X)-1 X ' E(u) = ? 以一元线性回归模型,yt = ?0 + ?1 xt + ut,为例,5 ? ?1 ? ?1 ? ? kt ut ? E ( ?1 ) ? E ( ?1 ? ? kt ut ) ? ?1 ? ? kt E (ut ) ??1(2) ?? 丧失有效性。? ? ? Var( ? ) = E [( ? - ? ) ( ? - ? )' ] = E [(X 'X )-1 X ' u u' X (X 'X)-1 ]= (X ' X)-1 X ' E (u u' ) X (X ' X )-1= (X 'X )-1 X ' ? X (X ' X )-1(6.13)与 ? 2 (X ' X )-1 不等。 以一元线性回归模型,yt = ?0 + ?1 xt + ut,为例,当 ut 非自相关时? ? ? ? Var ( ? 1 ) = E( ? 1 - E ( ?1 ) )2 = E( ? 1 -?1)2= E(? (k u )t t2=E ??? (k u ?2 2 t t? ) ? 2? kt k s ut us ? = ? kt2 E (ut2 ) ? 2? kt ks E (ut us ) t?s ? t ?s? 不存在自相关的假定下, E (ut us ) =0,估计值 ?1 的方差为:? Var ( ? 1 )=? k E(u ) ? 2? kt ks E(utus ) = ? 2 ? kt2 =2 t 2 t t ?s? (x ? x )t?22? 存在自相关的假定下, E (ut us ) ≠0,设参数估计值为 ?1 ,方差为: ? Var ( ?1 )=*?k2 t? E (ut2 ) ? 2? kt ks E (ut us ) =Var ( ? 1 )+ 2? kt ks E (ut us )t ?s t ?s如果误差项为正相关, E (ut us ) >0,则? ? Var ( ?1* )>Var ( ? 1 ) ? ? 表明存在自相关的参数估计值 ?1* 的方差比不存在自相关参数估计值 ? 1 的方差大,此时参数估计值的方差不是最小的。 如果 ut 存在自相关时仍用最小二乘估计参数, 就 极可能低估参数值的真实方差。 (3) 有可能低估误差项 ut 的方差。 由第二章知道,如果是一元线性回归模型, ? 2 的无偏估计量为:? ?2 ? ? et2T ?2,但是如果存在一阶自相关,可以证明:6 E (? et2 ) ? ? 2 (T ? 2) ,即E (? et2 ) (T ? 2)? ? 2 ,也就是会低估随机误差项的方差。这一情况的出现,会使参数估计值的标准误差进一步降低。 (4) 模型的统计检验失效 如果随机误差项的方差被低估,在进行 F 检验时,就会造成 F 统计量 F=SSE /(k ? 1) 中 RSS 的虚假缩小及 ESS 的虚假增大,从而使 F 统计量虚增,检验 SSR /(T ? k )失效。 低估回归参数估计量的方差,等于夸大了回归参数的抽样精度(t =? ?1 ? ?? ( xt ? x ) 2) 过高的估计统计量 t 的值, , 从而把不重要的解释变量保留在模型里,使显著性检验失去意义。 (5) Var( ??1 ) 和 su2 都变大,都不具有最小方差性。所以用依据普通最小二乘法得到 的回归方程预测区间精度降低,预测失效,模型失去经济分析与预测功能。6.3. 自相关检验下面介绍三种判别与检验方法。 6.3.1 图示法? ? 图示法就是依据残差 u t 对时间 t 的序列图作出判断。由于残差 u t 是对误差项 ut 的 ? 估计,所以尽管误差项 ut 观测不到,但可以通过 u t 的变化判断 ut 是否存在自相关。 ? 图示法的具体步骤是,(1) 用给定的样本估计回归模型,计算残差 u t , (t = 1, 2, … ? T), 绘制残差图; 分析残差图。 (2) 若残差 u t 随时间呈现有规律的变动, 则存在自相关。如与图 1.1 a 类似,则说明 ut 不存在自相关;若与图 1.1 c 类似,则说明 ut 存在正自相 关;若与图 1.1 e 类似,则说明 ut 存在负自相关。 图示法可以借助 EViews 软件来实现。在方程窗口中单击“Resids”或“View→ Actual,Fitted,Residual” →“Table”都可以得到残差分布图。 6.3.2 德宾―沃森 DW(Durbin-Watson)检验法7 ? DW 检验是 J. Durbin, G. S. Watson 于
年提出的。它是利用残差 u t 构成的统计量推断误差项 ut 是否存在自相关。使用 DW 检验,应首先满足如下五个条件。 (1) (2) (3) (4) (5) 误差项 ut 的自相关为一阶自回归形式。 因变量的滞后值 yt-1 不能在回归模型中作解释变量。 样本容量应充分大(T ? 15) 截距不能为零 解释变量为非随机变量。对一般经济现象而言,两个随机项在时间上相隔越远,前者对后者的影响就越小, 如果存在相关的话,最强的相关应表现在相邻两个随机变量之间,即一阶自相关。鉴 于此,DW 检验步骤如下。给出假设 H0: ? = 0 (ut 不存在自相关)H1: ? ? 0 (ut 存在一阶自相关)? 用残差值 u t 计算统计量 DW。? ? (uDW =t ?2Tt? ? u t ?1 ) 2(6.14)?t ?1T?2 ut其中分子是残差的一阶差分平方和,分母是残差平方和。把上式展开,?DW =t ?2T?2 ut ??t ?2T? 2 u t ?1 ? 2T 2 t? ? ?u ut t ?2Tt ?1? ?ut ?1(6.15)因为当样本充分大时,有?t ?2T?2 ut ≈?t ?2T? 2 u t ?1 ≈? ?ut ?1T2 t(6.16)把(1.15)式中的有关项用上式中第 2 项代换,2DW ≈? ?ut ?2Tt ?12?2? ? ?u ut t ?2 2Tt ?1? ? ?u utTt ?1? ?ut ?2T= 2 (1 -t ?2 Tt ?1? ?ut ?2? ) = 2 (1 - ? )2(6.17)t ?1因为 ? 的取值范围是 [-1, 1],所以 DW 统计量的取值范围是 [0, 4]。? 与 DW 值8 的对应关系见表 1.1。表 1.1? ?=0 ?=1 ? = -1 0&?&1 -1 & ? & 0? 与 DW 值的对应关系及意义 DW ut 的表现 DW = 2 ut 非自相关 DW = 0 ut 完全正自相关 DW = 4 ut 完全负自相关 0 & DW & 2 ut 有某种程度的正自相关 2 & DW & 4 ut 有某种程度的负自相关实际中 DW = 0, 2, 4 的情形是很少见的。当 DW 取值在(0, 2)(2, 4)之间时, , 怎样判别误差项 ut 是否存在自相关呢?推导统计量 DW 的精确抽样分布是困难的, 因? ? 为 DW 是依据残差 u t 计算的,而 u t 的值又与 xt 的形式有关。DW 检验与其它统计检验不同,它没有唯一的临界值用来制定判别规则。然而 Durbin-Watson 根据样本容量和 被估参数个数,在给定的显著性水平下,给出了检验用的上、下两个临界值 dU 和 dL 。 判别规则如下:图 1.2(1) 若 DW 取值在(0, dL)之间,拒绝原假设 H0 ,认为 ut 存在一阶正自相关。 (2) 若 DW 取值在(4 - dL , 4)之间,拒绝原假设 H0 ,认为 ut 存在一阶负自相关。 (3) 若 DW 取值在(dU, 4- dU)之间,接受原假设 H0 ,认为 ut 非自相关。 (4) 若 DW 取值在(dL, dU)或(4- dU, 4 - dL)之间,这种检验没有结论,即不能 判别 ut 是否存在一阶自相关。判别规则可用图 1.2 表示。 当 DW 值落在“不确定”区域时,有两种处理方法。①加大样本容量或重新选取 样本,重作 DW 检验。有时 DW 值会离开不确定区。②选用其它检验方法。 DW 检验表 4 给出 DW 检验临界值。DW 检验临界值与三个参数有关。①检验水平?,②样本容量 T , ③原回归模型中解释变量个数 k(不包括常数项) 。注意: ①因为 DW 统计量是以解释变量非随机为条件得出的,所以当有滞后的内生变量 作解释变量时,DW 检验无效。这时的表现是 DW 值常常接近 2。当估计式为9 yt = ?0 + ?1 yt-1 + ?2 xt + ut 时,Durbin 认为应该用下面的 h 统计量检验一阶自相关。? h= ?T ? 1 ? T (Var ( ? 1 ))= (1-T DW ) ? 2 1 ? T (Var ( ? 1 ))Durbin 已证明 h 统计量近似服从均值为零方差为 1 的标准正态分布。可以用标准? 正态分布临界值对 h 的显著性作出检验。注意:当 T (Var ( ?1 )) &1 时检验无效。②不适用于联立方程模型中各方程的序列自相关检验。 ③DW 统计量不适用于对高阶自相关的检验。 6.3.3 LM 检验(亦称 BG 检验)法(布罗斯-戈弗雷检验或称拉格郎日乘数)DW 统计量只适用于一阶自相关检验,而对于高阶自相关检验并不适用。利用 BG 统计量可建立一个适用性更强的自相关检验方法,既可检验一阶自相关,也可检验高 阶自相关。BG 检验由 Breusch-Godfrey 提出。BG 检验是通过一个辅助回归式完成的, 具体步骤如下。 对于多元回归模型 yt = ?0 + ?1x1 t + ?2 x2 t + … + ? k C1 x k-1 t + ut 考虑误差项为 n 阶自回归形式 ut = ?1 ut-1 + … + ?n ut - n + vt 其中 vt 为随机项,符合各种假定条件。零假设为 H0: ?1 = ?2 = …= ?n = 0 这表明 ut 不存在 n 阶自相关。用估计(6.18)式得到的残差建立辅助回归式,? ? ? ? yt =?0 +?1x1 t +?2 x2 t + … + ? k C1 x k-1 t + ? 1 u t ?1 + … + ? n u t ?n + vt(6.18)(6.19)(6.20)? 上式中的 u t 是(6.18)式中 ut 的估计值。估计上式,并计算可决系数 R2。构造 LM 统计量, LM = T R2 (6.21)其中 T 表示(6.18)式的样本容量。R2 为(6.20)式的可决系数。在零假设成立条件 下,LM 统计量渐近服从 ?2(n) 分布。其中 n 为(6.19)式中自回归阶数。如果零假设 成立,LM 统计量的值将很小,小于临界值。 判别规则是,若 LM = T R2 ? ?2(n),接受 H0;10 若 LM = T R2 & ?2(n),拒绝 H0; 利用 VEiews 软件可直接进 B-G 检验,在方程窗口“View”→“Residual Test”→ “Serial Correlation LM Test” 一般从 1 阶开始,到 10 阶左右,若未能得到显著的检验结果,可以认为不存在自 相关性。 6.3.4 回归检验法 回归检验法的优点是, (1)适合于任何形式的自相关检验, (2)若结论是存在自 相关,则同时能提供出自相关的具体形式与参数的估计值。缺点是计算量大。回归检 验法的步骤如下:? ①用给定样本估计模型并计算残差 u t 。 ? ②对残差序列 u t , (t = 1 ,2 ,… , T ) 用普通最小二乘法进行不同形式的回归拟合。 如 ? ? u t = ? u t C 1 + vt ? ? ? u t = ?1 u t C 1 + ?2 u t C 2 + vt ? ? 2 ut = ? ut - 1 + v t? ? u t = ? u t ?1 + vt… (3) 对上述各种拟合形式进行显著性检验,从而确定误差项 ut 存在哪一种形式的 自相关。 例: (P205)略6.4. 克服自相关如果模型的误差项存在自相关,首先应分析产生自相关的原因。如果自相关是由 于错误地设定模型的数学形式所致,那么就应当修改模型的数学形式。怎样查明自相? 关是由于模型数学形式不妥造成的?一种方法是用残差 u t 对解释变量的较高次幂进行回归,然后对新的残差作 DW 检验,如果此时自相关消失,则说明模型的数学形式不 妥。 如果自相关是由于模型中省略了重要解释变量造成的,那么解决办法就是找出略11 去的解释变量,把它做为重要解释变量列入模型。怎样查明自相关是由于略去重要解? 释变量引起的?一种方法是用残差 u t 对那些可能影响因变量但又未列入模型的解释变量回归,并作显著性检验,从而确定该解释变量的重要性。如果是重要解释变量,应 该列入模型。 只有当以上两种引起自相关的原因都消除后,才能认为误差项 ut “真正”存在自 相关。在这种情况下,解决办法是变换原回归模型,使变换后的随机误差项消除自相 关,进而利用普通最小二乘法估计回归参数。这种变换方法称作广义最小二乘法。下 面介绍这种方法。 6.4.1 广义差分法 设原回归模型是 yt = ?0 + ?1x1 t + ?2 x2 t+ … + ? k x k t + ut 其中 ut 具有一阶自回归形式 ut = ? ut-1 + vt 其中 vt 满足通常的假定条件,把上式代入(1.19)式, yt = ?0 + ?1 x1 t +?2 x2 t + … + ?0 xk t + ? ut - 1 + vt 求模型(1.19)的 (t - 1) 期关系式,并在两侧同乘 ?, (6.20) (t = 1, 2, …, T ) (6.19)? yt -1= ? ?0 + ? ?1 x1 t -1 + ? ?2 x2 t -1 + … + ? ?k xk t - 1 + ? ut - 1用(1.19)式与上式相减得 yt - ? yt -1 = ?0 (1 - ?) + ?1 (x1t - ? x1 t-1) +… + ?k ( xk t - ? xk t -1) + vt 令 yt* = yt - ? yt -1 , xj t* = xj t - ? xj t - 1, j=1,2,…k(6.21)(6.22)(6.23) (6.24) (6.25)?0* = ?0 (1 - ? ),则模型(1.22)表示如下, yt* = ?0*+ ?1 x1 t* + ?2 x2 t* +… + ?k xk t* + vt( t = 2 , 3 ,… T ) (6.26)上述变换称作广义差分变换。上式中的误差项 vt 是非自相关的,满足假定条件, 所以可对上式应用最小二乘法估计回归参数。所得估计量具有最佳线性无偏性。上式 中的 ?1 … ?k 就是原模型(1.19)中的 ?1 … ?k,而 ?0* 与模型(6.19)中的 ?0 有如12 下关系,?0* = ?0 (1 - ?),注意:?0 = ?0* / (1 - ?)(6.27)(1)对(6.19)式进行 OLS 估计得到的?0, ?1, … , ? k 的估计量称作普通最小二乘 估计量;对(6.26)式进行 OLS 估计得到的?0, ?1, , … , ? k 的估计量称作广义最小二乘 估计量。 (2)这种广义差分变换损失了一个观测值,样本容量变成(T- 1) 。为避免这种损 失,K. R. Kadiyala(1968)提出对 yt 与 xj t 的第一个观测值分别作如下变换。 y1* = y1 1 ? ? 2 x j 1* = xj 1 1 ? ? 2 , (j=1,2,…k)于是对模型(1.26) ,样本容量仍然为 T。 这种变换的目的就是使相应误差项 u1 的方差与其它误差项 u2, u3,…uT,的方差保持 相等。作上述变换后,有 u1* = u1 1 ? ? 2 则 Var(u1*) = (1 - ?2 ) Var(u1) 把(1.10)式代入上式, Var(u1*) = (1 - ? 2 ) [?v 2 / (1 - ? 2 )] = ?v 2 u1 与其他随机误差项的方差相同。 (3)当误差项 ut 的自相关具有高阶自回归形式时,仍可用与上述相类似的方法 进行广义差分变换。比如 ut 具有二阶自回归形式, ut = ?1 ut- 1 + ? 2 utC 2 + vt , 则变换过程应首先求出原模型(t-1)期与(t-2)期的两个关系式,然后利用与上述相 类似的变换方法建立符合假定条件的广义差分模型。若 ut 具有 k 阶自回归形式,则首 先求 k 个不同滞后期的关系式, 然后通过广义差分变换使模型的误差项符合假定条件。 需要注意的是对二阶自回归形式,作广义差分变换后,要损失两个观测值;对 k 阶自回归形式,作广义差分变换后,将损失 k 个观测值。13 (4) 当用广义差分变量回归的结果中仍存在自相关时, 可以对广义差分变量继续 进行广义差分直至回归模型中不存在自相关为止。 6.4.2 克服自相关的矩阵描述 对于线性回归模型 Y = X? + u 假定 E(u u ') = ? 2I 不成立。误差项 ut 具有一阶自回归形式自相关, ut = ? u t -1 + vt 则 Cov(u) 由 (6.12) 式给出? 1 ? ? ? 2 Cov(u) = E(u u ' ) = ? = ?u ? . ? T ?1 ?? ?(6.28)?1 .?2 ?.?T ?2?T ?3... ? T ?1 ? ? ... ? T ?1 ? . . ? ? ... 1 ? ?其中?u2 = ?v 2 / (1 - ? 2)。取? 1? ? 2 ? ? ?? M= ? ? ? ? ? 0 ? 0? ? ? ? (按 K. R. Kadiyala 提议补上第一个观测值) ? ? ? 1? ?1 ... 1 ??使 M ? M ' = ?v 2 I 用 M 左乘模型(6.28) , MY=MX?+Mu 令 Y* = M Y, X* = M X, 则模型(6.30)表示为 Y* = X*? + u* 其中 (6.31) u* = M u (6.30) (6.29)14 u* = M u? 1? ? 2 ? ? ?? =? ? ? ? ? 0 ?1 ... 1 ??0? ? ? ? ? ? ? 1? ?? u 1 ? ? u 1 ? ? 2 ? ?u ? ? 1 ?u ? ? 1 2 ? ? u ? ?u ? ? ? 2 1 ? u 3 ? = ? u ? ?u ? = ? 2 ? ? ? ? ? 3 ? ? ... ? ? ... ? ?u T ? ?u T ? ?u T ?1 ? ? ? ? ? ? ? ? ? ?1? ? 2 ? ? ? v2 ? v3 ? ? ... ? vT ? ?(6.32)(6.31) 和(6.32)式中带*号变量的变换规则与(6.24)和(6.25)式中相应带*号的变 量变换规则相同,所以模型 (6.31) 是广义差分变换模型。因为? 1? ? 2u ? 1 ? ? v2 ? ? Var(u*) = E[u*u*' ] = E[ ? ? ? 1 ? ? 2 u1 v2 v3 ? ? ? ? ? ? ? ? ? vT ?v3 ? vT ? ] ??(1 ? ? 2 )u12 ? 0 = E? ? ? ? 0 ? ?0 ? ? v2 2 ? 0 ? = ? ? ?? ? 0 ? vT 2 ? ? 0 ??? v 2 0 ? 2 ? 0 ?v ?? ? ? 0 ? 0 ?0 ? ? ? 0 ? = ? 2I v ? ?? ? ? ? v2 ? ? ?说明变换后模型(1.31)的误差项中不再有自相关。用普通最小二乘法估计 (6.31) 式 中的 ?。? ? * = (X* ' X*)-1X* ' Y*.(6.35)? 则 ? * 具有最佳线性无偏性。把原数据代入(1.35)式? ? * = [(M X )' (M Y ) ]C1(M X )' (M Y ) = (X ' M ' M X ) C1 X ' M ' M Y (6.36)0 ? ? ? ?. ? ? ?? 1 ? ?= (X ' ? -1 X) C 1 X ' ? - 1 Y,?? ? 1 ?? ? 1 ? ? 2 ? M ' M = ? -1 = ? ? ? ? 0 ? ?? ... ? ? 1? ? ??2其中(6.37)这正是广义最小二乘法,表明广义差分法与加权最小二乘法一样,是广义最小二 乘法的特例。 6.4.3. 自相关系数的估计 上一节介绍了解决自相关的方法。 这种方法的应用还有赖于知道 ? 值。 下面介绍15 两种估计 ? 的方法。 (1) 用 DW 统计量估计?。? 由(6.17)式,DW = 2 (1 - ? ),得? ? = 1 -(DW / 2)(6.41)? 首先利用残差 u t 求出 DW 统计量的值,然后利用上式求出自相关系数 ? 的估计值。注意:①用此法时样本容量不宜过小。②此法不适用于动态模型(即被解释变量 滞后项做解释变量的模型) 。 (2) Durbin 两步估计法 根据广义差分变换模型得:yt ? ? yt ?1 ? ?0 (1 ? ? ) ? ?1 ( xt ? ? xt ?1 ) ? vt整理得:yt ? ?0 (1 ? ? ) ? ? yt ?1 ? ?1 xt ? ??1 xt ?1 ? vt令: ? 0 (1 ? ? ) ? ? 0 , ?1 ? ?1 , ? ??1 ? ? 2 得:yt ? ? 0 ? ? yt ?1 ? ?1 xt ? ? 2 xt ?1 ? vt这是一个满足基本假定的三元线性回归模型,其中,解释变量 Yt-1 回归系数恰好? ? 为 ? 。对上述模型进行 OLS 估计,可得到 ? 的估计值 ? ,利用 ? 进行广义差分,这称为 Durbin 两步估计法。这种方法也适用于多元线性回归模型。其优点是不但求出自相 关系数,而且也得出了参数的估计值。 (3) 迭代估计或科克伦-奥克特(Cochrane-Orcutt)估计 迭代法是依据 ? 的近似估计公式, 通过一系列的迭代运算, 逐步提高近似值的计算 精度。步骤为: 1)利用 OLS 法估计模型: yt = ?0 + ?1x1 t + ut,计算第一轮残差 et (1)16 ? 2) 利用 et (1) 计算 ? 的第一轮估计算: ? (1) ?? e (1)e (1) ? e (1)t t ?1 2 t? ? yt* ? yt ? ? (1) yt ?1 3) 进行广义差分变换: ? * 得广义差分方程: yt* ? A ? ?1 xt* ? vt ? ? xt ? xt ? ? (1) xt ?14) 再利用 OLS 法估 计模型,计算 第二轮 残差 et (2) 和 ? 和第二轮估计 值:? ? (2) ? ?? e (2)2 tet (2)et ?1 (2)? 5) 重复执行 3)、4)两步,直到前后两次的估计值比较接近,比时 ? (n ? 1) 作为 ? 的近似估计值,并用广义差分法进行变换,得到回归系数的估计值。 (4) 用残差直接自回归的方法估计?(特别对高阶自回归形式) 。 6.4.4 广义差分的 EViews 软件实现过程 在 EViews 软件中可以直接使用广义差分估计自相关性模型,步骤为: 1)利用 OLS 估计模型,系统将同时计算残差序列 RESID:LS Y C X。 2) 判断自相关类型: IDENT TESID 或在 Equation 窗口依次 “View”→Residual Test →correlogram-Q-Statistics,根据 et 和 et ? s 偏相关系数,初步确定自相关的类型。 3)利用广义差分法估计模型。在 LS 命令中加上 AR 项,系统将自动使用差分法估 计模型。如:LS Y C X AR(1) AR(2)?AR(P) 。 例:P212 略 8. 案例分析 案例1 天津市城镇居民人均消费与人均可支配收入的关系(file:AUTOCO6)改革开放()以来,天津市城镇居民人均消费性支出(CONSUM), 人均可支配收入(INCOME)以及消费价格指数(PRICE)数据见下表。现在研究人 均消费与人均可支配收入的关系。 先定义不变价格(1978=1)的人均消费性支出(Yt)和人均可支配收入(Xt)。 令 Yt = CONSUM / PRICE Xt = INCOME / PRICE 得散点图如图 1。显然 Yt 和 Xt 服从线性关系。17 1400 Y 0 600 400 X 200 0 500 00150 RESID 100 50 0 -50 -100 -150 78 80 82 84 86 88 90 92 94 96 98 00图1Yt 和 Xt 散点图图2残差图(1)估计线性回归模型并计算残差 用普通最小二乘法求估计的回归方程,得结果如下。? Yt = 111.44 + 0.7118 Xt(6.42) R2 = 0.9883, s.e. = 32.8, DW = 0.60, T = 23(6.5)(42.1)(2)检验误差项 ut 是否存在自相关 已知 DW = 0.60,若给定? = 0.05,查附表,dL = 1.26,dU = 1.44。因为 DW = 0.60 ? 1.26, 依据判别规则,认为误差项 ut 存在严重的正自相关。 BG(LM)自相关检验辅助回归结果是? ? u t = 0.6790 u t -1 + 3.1710 C 0.0047 Xt + vt(3.9)(0.2)(- 0.4)R2 = 0.43, DW = 2.00LM = T R2 = 23 ? 0.43 = 9.89 因为?20.05(1) = 3.84,LM = 9.89 & 3.84,所以 BG(LM)检验结果也说明(1)式存在自相 关。 (3)用广义最小二乘法估计回归参数? 首先估计自相关系数 ? 。依据式, ? ?=1-0.60 DW =1= 0.70 2 2对原变量做广义差分变换。 GDYt = Yt - 0.70 Yt -1 GDXt = Xt - 0.70 Xt C 1 以 GDYt, GDYt,t = 2 , 3 , … 22, 为样本再次回归,得 GDYt = 45.2 GDXt (3.7) (20.0) R2 = 0.95, s.e. = 23.2, DW = 2.31,18(6.43) () 查附表 4,dL = 1.26,dU = 1.43,因为 DW = 2.31 & (4 -1.43) = 2.57,依据判别规则, 已消除自相关。残差图见图 3。150 RESID 100 50 0 -50 -100 -150 78 80 82 84 86 88 90 92 94 96 98 00图3残差图? 由(1.46)式, ? 0 * = 45.2489。依据(1.43)式, ? ? ? ? 0 = ? 0 */(1- ? ) = 45..70) = 150.8297则原模型的广义最小二乘估计结果是? Yt = 150.8297 + 0.6782 Xt用普通最小二乘估计结果是? Yt = 111.44 + 0.7118 Xt(6.44) R2 = 0.9883, s.e. = 32.8, DW = 0.60, T = 23(6.5) 注意:(42.1)(1)回归方程(1.43)与(1.42)相比,R2 值有所下降。不应该因此不相信(1.43) 式的结果。原因是(1.43)式中的变量是广义差分变量,而不是原变量,所以致使 R2 值下降。两个回归式所用变量不同,两个 R2 之间没有可比性。 (2) (1.43)式中的回归系数与(1.44)式中的回归系数有差别。计量经济理论认 为用广义差分变换模型得到的回归系数估计量的特性优于误差项存在自相关的模型。 所以模型(1.43)中的回归系数的统计特性更好,0.6782 比 0.7118 更可信。从实际情 形分析,特别是最近几年,消费的收入边际系数 0.6782 更可信,0.7118 偏高。 (3)用 EViews 生成新变量的方法如下。假设已经建立关于 CONSUM,INCOME 和 PRICE 的工作文件。假设变量 Yt 和 Xt 分别用 Y 和 X 表示,从工作文件主菜单中点 击 Quick 键, 选择 Generate Series …功能。 这时会打开一个生成序列 (Generate Series by Equation)对话框。在对话框中输入如下命令(每次只能输入一个命令) , Y = CONSUM / PRICE19 X = INCOME / PRICE 按 OK 键。 变量 Y 和 X 将自动保存在工作文件中。 EViews 的 OLS 估计方法见第 2 章。 用 EViews 进行 BG(LM)自相关检验非常方便。以(6.42)式为例,具体步骤如 下。 (6.42) 在 式回归输出窗口中点击 View 键, 选择 Residual Tests/Serial Correlation LM Test …功能,会弹出一个设定滞后期(Lag Specification)对话框。输入 1,点击 OK 键,就会得到 LM = T R2 = 9.89 的 BG(LM)检验结果。案例 2(天津保费收入和人口的回归关系(二阶广义差分)(file:autoco5) )
年天津市的保费收入(万元)和人口(万人)散点图如下。300000 Y14LOG(Y)1220000010100000860 650 700 750 800 850 900 XX 4950700800900Lnyt = -11.18 + 0.0254 xt (-20.9)1.5 Residuals 1.0 0.5 0.0 -0.5 -1.0 -1.5 70 75 80 85 90 95(1.47) R2 = 0.9788, s.e. = 0.34, DW = 0.361. 5 Residuals 1. 0 0. 5 0. 0 - 0. 5 - 1. 0 - 1. 5 70 75 80 85 90 95(37.2)()(1.47) 式残差图(1.48) 式残差图对残差进行二阶回归? ? ? u t = 1.186 u t ?1 - 0.467 u t ?2 + vt(6.9)(-2.5)R2 = 0.71, s.e. = 0.19, TR2 = 1.6()推导二阶自相关 ut = ?1ut C 1+?2ut C2 + vt 的广义差分变换式。设模型为 yt = ?0 + ?1 xt + ut 写出上式的滞后一期、二期表达式并分别乘?1、?2:20(6.48) ?1 yt-1 = ?1?0 + ?1?1 xt-1 + ?1ut -1 ?2 yt-2 = ?2?0 + ?2?1 xt-2 + ?2ut -2用以上三式做如下运算,(6.49) (6.50)yt -?1 yt-1 -?2 yt-2 = ?0 -?1?0 - ?2?0 + ?1 xt - ?1?1 xt-1 - ?2?1 xt-2 + ut -?1ut - 1-?2ut -2 (yt -?1 yt-1 -?2 yt-2) = ?0 (1- ?1 - ?2) + ?1 (xt - ?1 xt-1- ?2 xt-2) + vt 作二阶广义差分(注意:不要用错符号) 。 GDLnyt = Lnyt -1.186 Lnyt-1 +0.467 Lnyt-2 GDxt = xt -1.861 xt-1 + 0.467 xt-2 广义最小二乘回归 GDLnyt = -3.246 +0.0259 GDxt (-10.0) (17.9) 由(1.48)式,因为 (6.52) () (6.51)R2 = 0.92, s.e. = 0.19, DW = 1.99?0 (1 -1.186 + 0.467) = -3.246 ?0 = -11.55所以,原模型的广义最小二乘估计是 Lnyt = -11.55 + 0.0259 xt (6.53)案例 3中国宏观消费分析(file:china)按照我国现行国民经济核算体系,国内生产总值(按支出法计算)是由最终消费、 资本形成总额和货物与服务的净出口之和三部分组成。前两部分占绝大多数。其中最 终消费又分为居民消费和政府消费两类。而居民消费又可分为农村居民消费和城镇居 民消费。 在这种核算体系下,居民消费包括居民个人日常生活中衣、食、住、用等物质消 费以及在文化生活服务性支出中属于物质产品的消费。 政府消费包括国家机关、国防、治安、文教、卫生、科研事业单位,经济建设部 门的事业单位,人民团体等非生产机构使用的燃料、电力、办公用品、图书、设备等 物质消费。 国内生产总值中最终消费与资本形成总额的比例关系,即旧核算体系下国民收入 中消费与积累的比例关系是国民经济正常运行的最基本的比例关系。如果这一比例关21 系发生严重失调,最终会成为制约经济正常运行的严重障碍。 下面分析中国的消费问题。为消除物价变动因素以及异方差的影响,以下分析所 用的数据均为不变价格数据(1952 = 1)以及分别取自然对数后的数据。 图 1.1 给出不变价格的国内生产总值与消费曲线,图 1.2 和图 1.3 分别给出国内生 产总值与消费的年增长率曲线。25000 CONSP 20000 GDPP0 . 2 0 . 1 0 . 3 growth of consumption growth of GDP150000 . 010000- 0 . 15000- 0 . 2 - 0 . 30 55 60 65 70 75 80 85 90 95 0055606570758085909500图 6.1国内生产总值与消费(不变价格)曲线图 6.2国内生产总值年增长率曲线由图 6.1、6.2 可以看出国内生产总值与消费的增长都很快。国内生产总值曲线的 波动幅度相比较大。消费曲线的波动幅度相对较小。这与宏观消费行为具有“惯性” 有关。他既不可能随时间突然大幅增加,也不可能随时间突然大幅减少。表1 改革前后两个时期年平均增长率及其标准差的比较平均增长率 GDP 消费0.3 growth rate of GDP 0.2 0.1 0.0 -0.1 -0.2 -0.3 55 60 65 70 75 80 85 90 95 000 . 2 0 . 1 0 . 0 - 0 . 1 - 0 . 2 - 0 . 3 55 60 65平均增长率5.76% 4.79%年增长率的标准差 0.10 0.050 . 39.15% 9.18%年增长率的标准差 0.044 0.040growth rate of consumption70758085909500图 6.3国内生产总值年增长率曲线图 6.4消费额年增长率曲线首先结合图 1.3 对国内生产总值序列的增长率变化做进一步分析。 年国 民收入呈较稳步发展。以不变价格计算,平均年增长率为 7.97%。1958 年开始的大跃 进使经济发展速度突然加快。在计划经济体制下,这种人为的提高经济发展速度超出22 了国家物质基础所能承受的限度,所以在维持了短短两年超高速增长(1958 年的年增 长率为 16.9%,1959 年的年增长率为 11.4%)之后,经济发展便出现了大倒退。1960 年几乎为零增长。1961 和 1962 年连续 2 年出现建国以来从未有过的负增长(分别为 -27.2% 和 -11.1%) 。由于国家及时采取了一系列经济调整措施, 年国民经 济迅速得到恢复,并出现持续高增长态势。上述 4 年的增长率分别为 17.8%, 15.8%, 16.1% 和 12.5%。1966 年开始的文化革命使中国经济进入一个很不稳定的发展阶段。 1967 和 1968 年国民经济再度出现负增长,随后经济发展出现“振荡”现象。自 1978 年实行改革开放政策以来, 在由计划经济向市场经济转变过程中, 经济发展突飞猛进。
年国民收入年平均增长率为 5.76%。 年的年平均增长率为 9.15%。后一时期是前一时期的 1.6 倍(不变价格) 。年增长率的标准差却比前一时期 减小了一倍多。说明经济波动减小,宏观管理更加成熟。在后一时期里,经济增长速 度如此之高,持续时间如此之长,发展趋势如此之稳定,在我国的经济发展史上是没 有先例的。0.9 RATIO 0.80.90HOURATIO0.95 household/total0.70.850.60.800.50.4 55 60 65 70 75 80 85 90 95 000.75 55 60 65 70 75 80 85 90 95 00图 1.5消费率、居民消费率曲线图 1.6居民消费与总消费比的变化曲线下面分析消费率(消费额 / 国内生产总值,)序列的变化。见图 1.5, 总的来说变化幅度较大。 (1)从趋势看,中国宏观消费比率、居民消费率值的变化是逐年下降。消费比率 数据对时间 t(1952 =1)的回归结果如下: ratio = 0.7581 C 0.0036t (62.9) (-8.8) R2 = 0.61 ()51 年间消费比率值平均每年减少 0.0036。 居民消费率数据对时间 t(1952 =1)的回归结果如下: houratio = 0.7117 C 0.0049 t23 (59.4)(-12.1)R2 = 0.75()51 年间居民消费率平均每年减少 0.0049。居民消费率下降快,是由于居民消费对总消 费比的下降造成的。 (2)以 1978 年为界,改革开放之前()消费比率曲线波动大,改革开 放之后()消费比率曲线波动小(见图 1.5 和表 1) 。 年宏观消费 比率值的均值是 0.7057, 标准差是 0.0656。
年宏观消费比值的均值是 0.6206。 标准差是 0.0324。 改革开放以后宏观消费比率值平均比改革开放前下降 0.085。 随着时 间的推移,消费比率的均值减小,标准差减小。改革开放之后标准差减小说明宏观消 费比率值的波动在减小,中央政府调控宏观经济的能力逐步在提高。 (3)宏观消费比率的最小值是 0.5660,最大值是 0.8379。都发生在上世纪 50 年 代末和 60 年代初的经济困难时期。最小值 0.5660 发生在 1959 年是由于基本建设投资 的极度扩张造成的 (1958 和 1959 年基本建设投资的年增长率分别是 87.7%和 30.0%) 。 最大值是 0.8379 发生在 1962 年是由于执行经济调整政策,首先解决人民生活所致。 (4) 中国宏观消费比率值自 1993 年起跌破 0.60 大关。 1995 年达到最低点 0.575。 近 10 年来,宏观消费比率值基本上在 0.60 以下徘徊,平均值是 0.5876。在中央政府 努力扩大消费的政策下虽然宏观消费比率值在 1999 和 2000 年回升至 0.60 以上,但 2001 和 2002 年又跌落到 0.60 以下。当然这并不意味着中国宏观消费绝对值的减少。 相反,宏观消费总量一直在快速提高。因为固定资产投资以更快的速度增长,所以导 致宏观消费比率值偏低。表2 特征数名称 均值 标准差 极大值 极小值 变异系数 样本容量 中国消费比率数据的特征数 消费比率的特征数 () 0.6 0.0 0.0930 27 消费比率的特征数 () 0.4 0.9 0.0522 24注: (1)消费比率 = 中国宏观消费 / GDP。 (2) 年消费和 GDP 数据摘自《新中国五十年统计资料汇编》,1999 中国统计出版社。 年消费和 GDP 数据摘自《中国统计年鉴》, 2003,中国统计出版社。 (3)消费比率数据的特征数用消费比率数据计算。(5)图 6.6 给出居民消费占总消费的比率曲线。该比值从 0.91 直线下降至 0.76。24 这一方面反映出政府消费越削越增的过程,同时也反映出居民消费占总消费的比率变 得更小。 中国宏观消费比率的国际比较 共选择 6 个工业发达国家和 4 个发展中国家和地区的 GDP 和宏观消费数据经计算 后,与中国进行宏观消费比率的对比。6 个工业发达国家是英国、美国、法国、意大 利、加拿大和日本(GDP 和消费均为年度数据,德国由于数据不全未选) 个发展中 。4 国家和地区是菲律宾、墨西哥、香港(GDP 和消费均为季节数据)和韩国(GDP 和消 费为年度数据) 。上述 10 个国家和地区的宏观消费比率曲线与中国宏观消费比率曲线 的对比分别见图 1.7 和图 1.8。11 个国家和地区宏观消费比数据的 5 个特征数见表 2。 结合图 1.7 和图 1.8 以及表 2,分析如下:图 1.7美国、英国、加拿大、法国、意大利、日本与中国的消费比率曲线比较图 1.8墨西哥、香港、菲律宾、韩国与中国大陆的消费比率曲线比较(1)在这 11 个国家和地区中,无论是和工业发达国家还是发展中国家和地区相25 比,中国的宏观消费比率是最低的。 (2)年平均消费比率在 0.7 以上的国家按消费比率值大小顺序排列是英国、菲律 宾、美国、法国、意大利、加拿大和墨西哥。年平均消费比率在 0.6~0.7 之间的国家是 日本、香港、韩国和中国。显然,这种差别与文化传统有着密切的联系。前 7 个国家 都是具有西方文化色彩的国家;而后 4 个国家都是具有东方文化色彩的国家。 (3)从消费比率的标准差和变异系数来看,排除菲律宾、墨西哥和香港(这 3 个国家的数据为季节数据, 他们的方差与其他国家无可比性) 中国和韩国是消费比率 , 值变化最大的国家。中国消费比率标准差是变化最小的法国和意大利的 3 倍多。在消 费比率低于 0.7 的国家与地区中,日本和韩国的消费比率曲线是先降后升;香港呈震 荡变化特征;而中国则是呈逐年下降趋势。 (4) 中国的消费比率值为什么呈一路下滑趋势?主要原因是全国固定资产投资增 长率(2002 年是 13.1%)多年来远远高于消费的增长率(2002 年是 5.8%) ,从而导致 消费比率值连年下滑。 (5)中国目前的宏观消费比率这样低好不好?从长期看不好,应该改变消费与 GDP 之间的这种低比例关系。原因有四。①宏观消费和固定资产投资是维持经济高增 长的两个最重要因素。在经济高增长条件下,消费比率偏低是靠连年的固定资产投资 高增长率维持的。而连年的固定资产投资高增长率必然带来人力、物力和财力的瓶颈 现象。中国近年来之所以没有出现像大跃进时期的物力和财力的瓶颈现象,主要是依 靠外国直接投资和借外债支撑的。但长期借外债后,还款将成为一个沉重负担,同时 经济长期超高速发展,高素质人才的缺乏将变得越来越突出。这些因素制约固定资产 投资的超高速增长将随着时间的延长越来越突出。②若没有一个合理的消费比率做支 撑,高投资比率将得不到延续,最终导致产品相对过剩和积压,经济发展速度下降。 ③提高消费比率,维持消费的高增长同样能带来经济的高增长。因为提高消费比率主 要刺激的是第三产业的发展。第三产业的发展在促进经济增长的同时,还可以扩大劳 动力的就业。为人民政府解决待业问题减轻压力。目前在这方面还有很大的潜力。以 2002 年为例,全国第三产业产值占 GDP 的比例只有 0.34。④以经济建设为中心,不 断提高中国人民的物质与精神生活水平是我们党和国家的工作重心,宏观消费比率长 期保持低位不是我们的目的。 基于我国 54 年经济发展经验以及目前的经济发展规模,把年消费率平均值控制在 0.65-0.70 是比较合理的模式。26 下面通过建立宏观消费计量经济模型进一步分析我国消费与国民收入的定量关 系。 (以下所用数据(,file:China)均以不变价格(1952 = 1)计算。 )
年国内生产总值与消费额散点图见图 1.10。 说明消费与国内生产总值之 间存在高度的线性关系。 (1)OLS 估计 用 CPt 表示消费额 (不变价格) GDPt 表示国内生产总值 , (不变价格) 用
, 年数据得消费函数的 OLS 估计结果如下:?CPt= 164.0124 + 0.5919GDPt (5.2) R2 = 0.998, (159.9) DW = 0.67, s.e. = 167.458 0 0 RESID 6 0 0 4 0 0 2 0 0 0 - 2 0 0(1.1)1 6 0 0 0 1 4 0 0 0 1 2 0 0 0 1 0 0 0 0 8 0 0 0 6 0 0 0 4 0 0 0 2 0 0 0 G D P 0 0 C O N S- 4 0 0 - 6 0 0 55 60 65 70 75 80 85 90 95 005 0 0 01 0 0 0 0 5 0 0 0 0 0 0 0 5 0 0 0 1 2 2图 1.108000国内生产总值与消费额散点图图 1.11600(1.1)式残差图RESIDGCONSP 6000400200400002000-2000 0 00GGDPP -400 55 60 65 70 75 80 85 90 95 00图 1.12 广义差分变量散点图图 1.13(1.4)式残差图(2)GLS 估计 以上模型的 DW 值很小, 严格地说模型存在自相关 (见图 1.11) 为消除自相关 ? 。 ( = 0.67) ,对变量进行广义差分。定义 GCPt = CPt - 0.665 CPt-1 GGDPt = GDPt - 0.665 GDPt-1 (1.2) (1.3)27 得估计的回归模型为,G D Ct P =?45.4845 + 0.5998 GGDPt (1.8) R2 = 0.9926, (80.4) DW = 1.63, s.e. = 131.4(1.4)上模型中不存在自相关。消费函数的 GLS 估计结果是?CPt= 135.7746 + 0.5998GDPt(1.5)(3)时间序列模型估计 消费函数的时间序列模型估计结果是 CPt = 129.0977 + 0.6018GDPt + ut , (1.28) R2 = 0.999, 则长期关系是 CPt = 129.0977 + 0.6018GDPt 综上消费与国内生产总值的真实比值是 0.60。 下面研究消费(不变价格)对国内生产总值的弹性系数。对消费和国内生产总值 取自然对数并回归,得如下结果,?ut = 0.7370 ut-1 + vt (5.4)(1.6)(54.8) DW = 1.7, s.e. = 132.3(1.7)LnCPt= 0.1932 + 0.9256 LnGDPt (3.0) R2 = 0.9965, (118.8) DW = 0.77, s.e. = 0.0584(1.8)对变量进行广义差分。定义 GLnCPt = LnCPt - 0.615 LnCPt-1 GLnGDPt = LnGDPt - 0.615 LnGDPt-1 得估计结果如下: G LnCPt = 0.0814 + 0.9234 G LnGDPt (1.6) R2 = 0.9857, (57.6) DW = 1.34, s.e. = 0.047?(1.9) (1.10)(1.11)原模型(1.8)的最小二乘估计结果是28 ?LnCPt= 0.2114 + 0.9234 LnGDPt(1.12)综上消费对国内生产总值的真实弹性是 0.9234。0.2 RESID 0.1 0.1 0.2 RESID0.0 0.0 -0.1 -0.1-0.2-0.3 55 60 65 70 75 80 85 90 95 00-0.2 55 60 65 70 75 80 85 90 95 00图 1.14(1.8)式残差图图 1.15(1.11)式残差图复习偏相关系数、复相关系数 6.偏相关系数 以上介绍了简单线性相关系数, 但是当两个变量 xt, yt 同时受其它变量 z1t, z2t, …, 影 响时, 有必要研究当控制其它变量 z1t, z2t, …,不变时, 该两个变量 xt, yt 之间的相关关系。 称这种相关关系为偏相关关系。以 3 个变量 xt, yt, zt,为例(多于 3 个变量的情形与此相 似。,假定控制 zt 不变,测度 xt, yt 偏相关关系的偏相关系数定义如下。 )? xt yt , zt = 控制 zt 不变条件下的 xt, yt 的简单相关系数。因为 zt 也是随机变量,一般不容易得到控制 zt 为一个常数条件下的 xt 和 yt 的值。 实际计算方法是,从 xt, yt 中分别剔除 zt 的影响,然后计算相关系数。步骤如下: (1)求 xt 对 zt 的回归估计式,? ? ? xt = ? 0 + ? 1 zt + u t计算残差,? ? ? u t = xt - ? 0 - ? 1 zt(6)? u t 中不再含有 zt 对 xt 的影响。(2)求 yt 对 zt 的回归估计式,? ? ? yt = ? 0 + ? 1 zt + v t计算残差,? ? ? v t = yt - ? 0 - ? 1 zt29(7) ? ? ? v t 中不再含有 zt 对 yt 的影响。则 u t 与 v t 的简单相关系数就是 xt 与 yt 在剔除 zt 的影响后的偏相关系数,即rut vt ? ?= rxt yt , zt(8)7.复相关系数 在多元回归中,用偏相关系数可以分别测量被解释变量对每个解释变量的偏相关 关系,而复相关系数则是测量被解释变量与全部解释变量的相关关系。假定 yt 是被解 释变量,解释变量是 xt1, xt2, …, xt k C1,复相关系数的具体计算过程是 (1)用 yt 对 xt1, xt2, …, xt k -1 回归,? ? ? ? yt = ? 0 + ? 1 xt1 +…+ ? k ?1 xt k -1 + u t(9)? 求出 yt 的拟合值序列 y t , ? (2)计算 yt 与 y t 的简单相关系数,则称 ryt yt 是 yt 与 xt1, xt2, …, xt k -1 的复相关系数。 ?复相关系数 ryt yt 与简单相关系数 r 的区别是简单相关系数 r 的取值范围是[-1,1], ? 复相关系数 ryt yt 的取值范围是[0,1]。 ? 复相关系数是原回归方程确定系数的算术根。30
计量经济学
自相关性―汇集和整理大量word文档,专业文献,应用文书,考试资料,教学教材,办公文档,教程攻略,文档搜索下载下载,拥有海量中文文档库,关注高价值的实用信息,我们一直在努力,争取提供更多下载资源。}

我要回帖

更多关于 自相关检验 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信