当前位置: 代码迷 >> 综合 >> 浙江大学【面板数据分析与STATA应用】——第二讲长面板数据分析与机制识别方法
  详细解决方案

浙江大学【面板数据分析与STATA应用】——第二讲长面板数据分析与机制识别方法

热度:56   发布时间:2024-01-31 13:21:51.0

长面板数据模型的估计方法

  • 第一种:使用OLS估计这个特殊的双向固定效应模型,并对误差项的自相关、异方差和截面相关的问题只提供面板校正的标准误(使用命令xtscc或xtpcse命令实现),这种估计方法最为稳健。
  • 第二种:如果存在自相关、异方差和截面相关的问题,则使用FGLS估计这个特殊的双向固定效应模型,这种方法只是解决了误差项自相关的问题,而并未考虑异方差或截面相关的问题,对于误差项的异方差和截面相关的问题仍然只是提供面板校正的标准误(使用命令xtpcse实现),这种估计方法介于稳健和效率之间。
  • 第三种:使用FGLS估计这个特殊的双向固定效应模型,对误差项的自相关、异方差和截面相关的问题一并加以处理(使用命令xtgls实现),这种估计方法最有效率

长面板数据类型的STATA估计命令

  1. stpcse
    命令格式:
xtpcse depvar indepvars,options

该命令的关键在于选项

A. 自相关的设定(一阶自相关)
a.corr(ar1),使用的估计方法为FGLS【误差项存在自相关时使用该选项;当T不比n大很多时使用该选项,因为此时T可能无法提供足够多的信息去估计每个个体的自相关系数,所以约束了每个个体的自相关系数都相等】
b.corr(psar1) ,使用的估计方法为FGLS【误差项存在自相关时使用该选项;当T比n大很多时使用该选择项,当T比n大很多时每个个体的自相关系数可以不同,就可以使用选项】
c.corr(independent)或corr(ind),使用的估计方法为OLS【误差项不存在自相关

B.异方差与截面的设定
a.independent【误差项不存在异方差和截面相关问题,使用该选项】
b.hetonly(提供考虑异方差的面板校正标准误)【误差项存在异方差但不存在截面相关问题,则使用该选项】
c.不加选项即可(提供既考虑异方差又考虑截面相关的面板校正标准误)【误差项存在异方差和截面相关问题时,不加任何选项】
选项:corr(ind)+independent等价于LSDV

  1. xtgls
    命令格式
xtgls depvar indepvars,options

如果对误差项的处理正确,那么xtgls比xtpcse估计效果更好

A.对异方差和截面相关的设定

a.panels(iid)****【误差项不存在异方差和截面相关】
b.panles(heteroskedastic)****【误差项存在异方差+截面不相关】
c.panels(correlated)只适用于长面板数据【误差项存在异方差+截面相关】
选项:corr(ind)+panels(iid)等价于LSDV

B.自相关的设定
a.corr(ar1),使用的估计方法为FGLS
#误差项存在自相关时使用该选项;当T不比n大很多时使用该选项,因为此时T可能无法提供足够多的信息去估计每个个体的自相关系数,所以约束了每个个体的自相关系数都相等
b.corr(psar1),使用的估计方法为FGLS。
#误差项存在自相关时使用该选项;当T比n大很多时使用该选择项,当T比n大很多时每个个体的自相关系数可以不同,就可以使用选项
c.corr(independent)或corr(ind),使用的估计方法为OLS。
#误差项不存在自相关时,使用该选项

  1. xtscc

实战操作

以香烟需求估计与三大检验为例,即数据集“mus08cigar.dta”,包括了美国10个州1963-1992年有关香烟消费量的相关变量。

第一步 模型设定

双向固定效应模型——(审稿人一般认为双向固定效应为逻辑起点)
在这里插入图片描述
其中,被解释变量 l n c lnc 为人均香烟消费量的对数,解释变量: l n p lnp 为实际香烟价格的对数, l n p m i n lnpmin 为相邻州最低香烟价格的对数, l n y lny 为人均可支配收入的对数。

  • 导入数据
use"D:\mus08cigar.dta"
  • 查看数据
des##结果
Contains data from D:\mus08cigar.dtaobs:           300                          vars:             6                          26 Nov 2008 17:14
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------storage   display    value
variable name   type    format     label      variable label
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
state           float   %9.0g                 U.S. state
year            float   %9.0g                 Year 1963 to 1992
lnp             float   %9.0g                 Log state real price of pack of cigarettes
lnpmin          float   %9.0g                 Log of min real price in adjoining states
lnc             float   %9.0g                 Log state cigarette sales in packs per capita
lny             float   %9.0g                 Log state per capita disposable income
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
  • 声明
xtset state year## 结果panel variable:  state (strongly balanced)time variable:  year, 63 to 92delta:  1 unit

告诉Stata软件,这是一个以截面变量state为州,时间变量为year的面板数据。由“strongly balance”可知,这是一个平衡面板数据。

第二步 描述性统计及作图

  • 描述性统计【sum + 变量名】
sum lnc lnp lnpmin lny## 结果Variable |        Obs        Mean    Std. Dev.       Min        Max
-------------+---------------------------------------------------------lnc |        300    4.792591    .2071792   4.212128   5.690022lnp |        300    4.518424    .1406979   4.176332    4.96916lnpmin |        300      4.4308    .1379243     4.0428   4.831303lny |        300    8.731014    .6942426   7.300023    10.0385
  • 绘制解释变量和被解释变量的散点图并画出回归直线
 twoway (scatter lnc lnp)(lfit lnc lnp)

在这里插入图片描述
lnp与lnc之间是负相关系的,与理论预期一致。

  • 绘制核心变量的时间序列图
xtline lnc

在这里插入图片描述

第三步 模型估计

  • 生成州虚拟变量
tab state,gen(state)##结果U.S. state |      Freq.     Percent        Cum.
------------+-----------------------------------1 |         30       10.00       10.002 |         30       10.00       20.003 |         30       10.00       30.004 |         30       10.00       40.005 |         30       10.00       50.006 |         30       10.00       60.007 |         30       10.00       70.008 |         30       10.00       80.009 |         30       10.00       90.0010 |         30       10.00      100.00
------------+-----------------------------------Total |        300      100.00
  • 生成时间趋势变量
gen t=year-62
  • 进行LSDV检验
reg lnc lnp lnpmin lny state2-state10 t##结果Source |       SS           df       MS      Number of obs   =       300
-------------+----------------------------------   F(13, 286)      =     56.65Model |  9.24427482        13  .711098063   Prob > F        =    0.0000Residual |  3.58977229       286  .012551651   R-squared       =    0.7203
-------------+----------------------------------   Adj R-squared   =    0.7076Total |  12.8340471       299  .042923234   Root MSE        =    .11203------------------------------------------------------------------------------lnc |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------lnp |     -1.027      0.104    -9.92   0.000       -1.231      -0.823lnpmin |      0.510      0.102     5.01   0.000        0.309       0.711lny |      0.498      0.153     3.26   0.001        0.197       0.798state2 |     -0.077      0.038    -2.01   0.045       -0.153      -0.002state3 |      0.089      0.029     3.01   0.003        0.031       0.146state4 |     -0.181      0.071    -2.54   0.012       -0.321      -0.041state5 |     -0.107      0.089    -1.20   0.231       -0.281       0.068state6 |      0.218      0.048     4.57   0.000        0.124       0.312state7 |      0.116      0.075     1.54   0.125       -0.032       0.263state8 |      0.107      0.049     2.17   0.031        0.010       0.204state9 |      0.043      0.033     1.32   0.189       -0.021       0.108state10 |     -0.134      0.033    -4.07   0.000       -0.198      -0.069t |     -0.043      0.012    -3.57   0.000       -0.067      -0.019_cons |      3.489      1.377     2.53   0.012        0.777       6.200
------------------------------------------------------------------------------
  • 保存结果
est store ols
  • 查看核心解释变量和被解释变量之间的偏相关图
avplot lnp

在这里插入图片描述

第四步 三大检验

  1. 自相关检验

检验误差项的自相关问题

xtserial lnc lnp lnpmin lny state2-state10 t## 结果Wooldridge test for autocorrelation in panel data
H0: no first order autocorrelationF(  1,       9) =     89.304Prob > F =      0.0000

P值为0,所以拒绝一阶自相关不存在的原假设,表明存在自相关问题。

  1. 异方差检验
    需要注意的是:
    【xttest3】只能在【xtreg,fe】和【xtgls】命令之后使用
    ssc install xttest3(第一次使用需要安装)
quietly xtreg lnc lnp lnpmin lny t,fe
xttest3##结果
Modified Wald test for groupwise heteroskedasticity
in fixed effect regression modelH0: sigma(i)^2 = sigma^2 for all ichi2 (10)  =     378.90
Prob>chi2 =      0.0000

P值为0,所以拒绝原假设,认为误差项存在异方差问题。

  1. 截面相关的检验
    需要注意的是
    使用命令【xttest2】对误差项的截面相关问题进行检验。
    【xttest2】只能在【xtreg,fe】、【xtgls】或【ivreg2】之后使用,只适用于长面板数据;
    第一次使用【xttest2】的同学,需要使用命令【ssc install xttest2】进行安装
. quietly xtreg lnc lnp lnpmin lny t,fe
. xttest2## 结果Correlation matrix of residuals is singular.
not possible with test
r(131);

我在这里遇到的问题是矩阵是奇异的,不能使用xttest2,但老师实例中得到结果是P值是0,拒绝了原假设,所以存在截面相关。

第五步 报告结果

通过三大检验,我们知道模型的误差项存在自相关、异方差和截面相关的问题,所以,我们需要对误差项的自相关、异方差和截面相关问题进行处理并报告计量结果。

xtpcse lnc lnp lnpmin lny state2-state10 t,corr(psar1)
est store xtpcse
xtgls lnc lnp lnpmin lny state2-state10 t,corr(psar1) panels(correlated)
est store xtgls
xtscc lnc lnp lnpmin lny state2-state10 t
est store xtscc
  • 通过esttab命令将所有的存储结果放在一起进行比较。
esttab ols xtpcse xtgls xtscc,b(%9.2f)p mtitle(ols xtpcse xtgls xtscc)obslast star(* 0.1 ** 0.05 *** 0.01)compress nogap k(lnp lnpmin lny t)
  相关解决方案