请问一下stata的面板数据结果怎么分析?

[图片] 就以这个图为例,比如0.1167(1.03)是怎么解读?
关注者
34
被浏览
63,130
登录后你可以
不限量看优质回答 私信答主深度交流 精彩内容一键收藏

陈强stata学习笔记,脑壳疼,需要相关资料可以联系我,免费无套路分享

1.知识点

1.面板数据的设定

xtset panelvar timevar
# 命令“xtset”告诉Stata 你的数据为面板数据
# 面板(个体)变量“panelvar”的取值须为整数且不重复,相当于将样本中每位个体进行编号
# timevar 为时间变量

假如“panelvar”本来是字符串(比如,国家名字country),可用以下命令转换为数字型变量:

encode country, gen(cntry)
# 选择项“gen(cntry)”表示将新生成的数字型变量记为cntry。这样,变量cntry 就以“1, 2, 3, …”来指代不同的国家。

显示面板数据统计特性的 Stata 命令:

xtdes
# (显示面板数据的结构,是否为平衡面板)
xtsum
# (显示组内、组间与整体的统计指标)
xtline varname
# (对每位个体分别显示该变量的时间序列图;如希望将所有个体的时间序列图叠放在一起,可加上选择项overlay)

2.混合回归

reg y x1 x2 x3,vce(cluster id)
# 进行混合回归,“id”指用来确定每位个体的变量
# vce命令显示回归系数协方差矩阵,对角线都是方差,其余的是协方差
# 选择项“vce(cluster id)”表示以变量id 作为聚类变量来计算聚类稳健的标准误。

3.固定效应

由于每个省的“省情”不同,可能存在不随时间而变的遗漏变量,考虑使用固定效应模型(FE)

xtreg y x1 x2 x3,fe r
# 选择项“fe”表示“fixed effects”(固定效应估计量),默认为
# “re”表示“random effects”(随机效应估计量)。
# 选择项“r”表示使用聚类稳健标准误;如使用选择项“vce(cluster id)”也能达到相同效果。

在使用命令“xtreg,fe”时,如不加选择项“r”(将估计结果记为“FE”),则输出结果还包含一个F 检验,其原假设为“ H0 :所有ui=0”,即可以接受混合回归:

xtreg ltvfo ltlan ltwlab ltpow ltfer hrs mipric1 giprice mci ngca,fe
estimates store FE

对于固定效应模型,也可使用一阶差分法(FD)。Stata 没有专门执行一阶差分法的命令, 但在使用命令“xtserial,output”对组内自相关进行检验时,可附带提供一阶差分法的估计结果(将此结果记为“FD”):

xtserial ltvfo ltlan ltwlab ltpow ltfer hrs mipric1 giprice mci ngca,output
estimates store FD

也可在固定效应模型中考虑时间效应,即双向固定效应(Two-way FE),以捕捉技术进步等效应。

xtreg ltvfo ltlan ltwlab ltpow ltfer hrs mipric1 giprice mci ngca t,fe r
estimates store FE_trend
# 为节省待估参数,首先加入时间趋势项(将估计结果记为“FE_trend”):
tab year,gen(year)
# 其次,加入年度虚拟变量。为演示目的,定义年度虚拟变量:

加入年度虚拟变量后,由于价格变量 mipric1 与giprice 在各省都一样,无法包括在回归方程中,以避免严格多重共线性。

xtreg ltvfo ltlan ltwlab ltpow ltfer hrs mci ngca year2-year18,fe r
estimates store FE_TW
# 进 行 含 时 间 虚 拟 变 量 的 双 向 固 定 效 应 估 计 ( 将结果记为“FE_TW”):
#year1(1970 年)作为基期,不包括在上述回归命令中
# 1980 年的hrs 数据缺失,故year11(1980 年)也被去掉。
test year2 year3 year4 year5 year6 year7 year8 year9 year10 year12 year13 year14 year15 year16 year17 year18
#检验所有年度虚拟变量的联合显著性:

4.LSDV 法

reg y x1 x2 x3 i.id,vce(cluster id)
# “id”表示用来确定个体的变量,“i.id”则表示根据变量
# “id”而生成的虚拟变量。选择项“vce(cluster id)”表示使用聚类稳健的标准误。

5.随机效应

个体效应还可能以随机效应(RE)的形式存在。

xtreg y x1 x2 x3,re r theta
# 选择项“re”为默认选项(可省略);
# 选 择 项 “ r ” 表示使用聚类稳健标准误。如使用选择项“vce(cluster id)”也能达到相同效果。
#选择项“theta”表示显示用于进行广义离差变换θ值。

对于随机效应模型,也可进行 MLE 估计,Stata 命令为

xtreg y x1 x2 x3,mle

进行随机效应(RE)的估计(将结果记为“RE_robust”):

xtreg ltvfo ltlan ltwlab ltpow ltfer hrs mci ngca,re r theta
estimates store RE_robust

2.示例

以数据集 lin_1992.dta 为例,取自Lin(1992)对家庭联产承包责任制(household responsibility system)与中国农业增长的经典研究。该省际面板包含中国 28 个省1970—1987 年有关种植业的数据。

被解释变量为“种植业产值对数”(ltvfo,1980 年不变价格)。解释变量包括:耕地面积对数(ltlan,千亩),种植业劳动力(ltwlab),机械动力与畜力对数(ltpow,千马力),化肥使用量对数(ltfer,千吨),截止年底采用家庭联产承包制的生产队比重(hrs),农村消费者价格与农村工业投入品价格之比的一阶滞后(mipric1,1950 年=100),超额收购价格与农村工业投入品价格之比(giprice,1950 年=100),复种指数(mci,播种面积除以耕地面积),非粮食作物占播种面积比重(ngca),时间趋势(t),province(省),year(年)。

为解决异方差问题,Lin (1992)将种植业产量、耕地面积、种植业劳动力、机械动力与畜力、化肥使用量这些传统的投入与产出变量都除以每省的生产队数目(team)。两个价格变量 mipric1 与giprice 为全国性指标,各省都一样,只随时间变化。

代码:

cd "数据所在文件夹"
# 定位数据文件夹
use lin_1992.dta,clear
xtset province year
xtset panelvar timevar
# 设定 province 与year 为面板(个体)变量及时间
xtdes
# 显示数据集的结构
xtsum ltvfo ltlan ltwlab ltpow ltfer hrs mipric1 giprice mci ngca
# 显示数据集中以上变量的统计特征:
xtline ltvfo
# 看被解释变量 ltvfo 在28 个省的时间趋势图
reg ltvfo ltlan ltwlab ltpow ltfer hrs mipric1 giprice mci ngca,vce(cluster province)
# reg y x1 x2 x3,vce(cluster id)
# 进行混合回归,“id”指用来确定每位个体的变量
# vce命令显示回归系数协方差矩阵,对角线都是方差,其余的是协方差
# 选 择 项 “ vce(cluster province) ” 表示, 使用以“province”为聚类变量的聚类稳健标准误。
estimates store OLS
# 将此结果储存,并记为“OLS”
reg ltvfo ltlan ltwlab ltpow ltfer hrs mipric1 giprice mci ngca
# 也可使用普通标准误进行回归
xtreg ltvfo ltlan ltwlab ltpow ltfer hrs mipric1 giprice mci ngca,fe r
# 由于每个省的“省情”不同,可能存在不随时间而变的遗漏变量,考虑使用固定效应模型(FE)
estimates store RE_robust

代码分叉:

xtreg ltvfo ltlan ltwlab ltpow ltfer hrs mipric1 giprice mci ngca,fe