-
精品文档
第十四章
向量自回归模型
本章导读:
前一章介绍了时间序列回归,
其基本知识为本章的学习奠定了基础。
p>
这一章将要
介绍的是时间序列回归中最常用的向量自回归,它独有的
建模优势赢得了人们的广泛喜爱。
14.1
VAR
模型的背景及数学表达式
VAR
模型主要应用于宏观经济学。
在
VAR
模型产生之初,
很多研究者<
/p>
(例如
Sims
,
1980
和
Litterman
,<
/p>
1976
;
1986
)就认为,
VAR
在预测方面要强于结构方程模型。
VAR
模型产生
的原因在于
< br>20
世纪
60
年代一大堆的结构
方程并不能让人得到理想的结果,
而
VAR
模型的预
测却比结构方程更胜一筹,
主要原因在于大型结构
方程的方法论存在着更根本的问题,
并且
结构方程受到最具挑战
性的批判来自卢卡斯批判,
卢卡斯指出,
结构方程组中的
“决策规则”
参数,
在经济政策改变时无法保
持稳定,
即使这些规则本身也是正确的。
因此宏观经济建模
p>
的方程组在范式上显然具有根本缺陷。
VAR
模型的研究用微观化基础重新表述宏观经济模型
的基本方程,与此同时,对经济变量之
间的相互关系要求也并不是很高。
我们知道经济理论往往是不
能为经济变量之间的动态关系提供一个严格的定义,
这使得
在解
释变量过程中出现一个问题,
那就是内生变量究竟是出现在方程的哪边。
这个问题使得
估计和推理变得复杂和晦涩。为了解决这一问题,向量自回归的方
法出现了,它是由
sim
于
1980<
/p>
年提出来的,自回归模型采用的是多方程联立的形式,它并不以经济理论为基础,
在模型的每一个方程中,
内生变量对模型的全部内生变量的滞后项进行回
归,
从而估计全部
内生变量的动态关系。
向量自回归通常用来预测相互联系的时间序列系统以及分析随机扰动项对变量系统的
动态影响。
向量自回归的原理在于把每个内生变量作为系统中所
有内生变量滞后值的函数来
构造模型,
从而避开了结构建模方法
中需要对系统每个内生变量关于所有内生变量滞后值的
建模问题。一般的
VAR(P)
模型的数学表达式是。
y
t
?
v
?
A
1
y
t
?
1
?
??
?
?
A
p
y<
/p>
t
?
p
?
B
0
x
t
?
B
1
x
t
?
1
?
???
?
B
q
x
t
?
q
?
?
t
t
?<
/p>
{
??
,
??<
/p>
}
(
14.1
)
(
y
1
t
p>
??????
y
Kt
)
其中
y
t
?
表示
K
×
1
阶随机向量,
A
1
到
A
p
表示
K
×
K
阶
的参数矩阵,
x
t
< br>表示
M
×
1
阶外生变量向量,
B
1
到
B
q
是
K
×
M
阶待估系数矩阵,<
/p>
并且假定
?
t
是白噪声序列;即,
E
(
?
t
)
< br>?
0,
E
< br>(
?
t
?
t
'
)
?
?
,
并且
E
(<
/p>
?
t
?
s
'
)
?
0,
(
t
?
s
)
。
< br>在实际应用过程之中,
由于滞后期
p
和
q
足够大,
因此它能够完整的反
映所构造模型的
全部动态关系信息。
但这有一个严重的缺陷在于
,
如果滞后期越长,
那么所要估计的参数就
会变得越多,
自由度就会减少。
因此需要在自由度与滞后期
之间找出一种均衡状态。
一般的
准则就是取许瓦咨准则(
SC
)和池此信息准则
(AIC)
两者统计量最小时的滞后期,其统计量
见式
(14
-2)
与式(
14-3
)
。
AIC
?
?
2
l
/
< br>n
?
2
k
/
n
(
14.2
)
。
1
欢迎下载
精品文档
SC
?
?
2<
/p>
l
/
n
?
k
log
n
/
n
(
14.3
)
式(
14-2
)与(
< br>14-3
)中
k
?
m
(
qd
?
pm
)
表示待估参数个数,
n
表示观测样本个数,
同时满足:
p>
?
?
nm
n
l
?
?
(1
?
log
2
?
)
?
log[det(
?
t
?
t
?<
/p>
t
'
/
n
)]
(
14.4
)
2
2
14.2
VAR
模型的估计
在对
VAR
模型进行估计时,首先必须对变量进行单位根检验。具体操作步骤见
本书前
面章节,在此不多加阐述了。
14.2.1 VAR
模型输入
p>
在
Eviews
里面设定
< br>VAR
模型之前必须创建
VAR
系统,
选择
quick/Estimate
< br>VAR
或者直
接在命令窗口内输入
var
。此时会出现
var
对话框,
你必须在对话框中填入适当的信息
,
如
下图
14.1
。
(1)
选择
VAR
估计的类型:<
/p>
Unrestricted
VAR
(非
限制性向量自回归)
或者
Vector
Error
Correct
(向量误
差修正模型)
,现在所谓的
VAR
是指
Unrestricted VAR
(非限制性向量自
回归)
,
Vector Error Corr
ect
(向量误差修正模型)将在下一步做进一步介绍。
(2)
设定需要估计的样本跨度。
(3)
在对话框(
Lag
Intervals for Endogenous
)键入适当的滞后期间隙,滞后期
间隙
必须是成对键入:每一对数字都定义了滞后期的区间,例如右图中:
1 4
表示
Eviews
使用
内生变
图
14.1
VAR
设定的对话框
量滞后第
1
期至第
4
期来估计
系统中的(
gdp cpi m1 r
)变量。你可以键入任何
成对滞后
数字。滞后期的设定如下:
2 4 6 9 12
上面数字意味着使
用滞后
2-4
,
6-9
和
12-12
。
(4)
在对话框中键入需要估计的内生变量和外生变量名称,此处我们把<
/p>
gdp
,
cpi
,
m1
和
r
作
为内生变量序列,
同时把常数项
c
作为
一个外生变量键入对话框内。
剩下来的对话标
签(
Cointegration
和
VEC
Restrictions
)仅仅和我们下一步需要介绍的向量误差修正模
型
。
2
欢迎下载
精品文档
有关。
14.2.2
VAR
模型输出
如果设定好
var
模型以后,
就可以点击
< br>ok
,
在
var
窗口中会显示估计的结果。
如图
14.2
。
图
14.2
VAR
模型估计结果
图中每一列代表相应
VAR
模型中每一个内生变
量的方程。
每一个变量的右端
Eviews
汇
报了待估系数,
标准差
(圆括号
内)
以及
t
统计量
(中括号内)
。
例如在方程
GDP
中
GDP(-1)
的系数为
0.848803
,标准差为
0.13700
p>
,
t
统计量为
6.
19545
,根据
t
统计量分布表,可
知
在
5%
的显著水平下,该系数是显著
不为
0
的。
在系数估计表的下端,
Eviews
汇
报了一些额外的信息,如图
14.3
。
图
14.3
VAR
模型回归统计量
在图
14.3
中,第一部分表示的是每一个方程标准的
OLS
统计量。根据各自的残差分别
计算每一个方程的结果,
并显示在对应的每一列中。
输出的第二部分表示的是整个
p>
VAR
系统的回归统计量。
残差的协方差行
列式值
(自由度
进行调整以后)的计算原理是
< br>
?
?
?
1
?
?
det(
?
t
?
t
'
)
(
14.5
)
?
T
?
m
p>
t
在式(
14-
5
)中
m
表示的是
VAR
系统中每一个方程待估参数的个数,非调整的估计可
。
3
欢迎下载
精品文档
以忽略
m
。通过假定服从多元正态分布(高斯分布)的似然对数值的计算如下:
?
T
l
?
?
{
k
(1
?
log
2
< br>?
)
?
log
< br>?
}
(
14.6
)
2
AIC
和
< br>SC
两个信息准则的计算原理如下:
AIC
?
?
2
l
/<
/p>
T
?
2
n
/
T
(
14.7
)
SC
?
?
2<
/p>
l
/
T
?
n
log
T
/
T
(
14.8
)
其中
n
?
k<
/p>
(
d
?
mk
p>
)
表示
VAR
模型
中待估参数的总数,
根据这些准则可以决定
VAR
模型
适当的滞后期长度,这些准则的值越小,那么模型的滞后期就越合适。<
/p>
14.3
VAR
模型的诊断
如果完成了
VAR
模型的估计,那么
Eviews
会提供各种视窗来反映估计的
VAR
模型是否
恰当。
在这一节中我们将要讨论
VAR
模型的设定,
并对
VAR
模型进行诊断。
在
VAR
系
统视窗
的
View/Lag Structure
和
View/Residual Tests
菜单下提供了一系列帮助我们进行
VAR
模型诊断的视
图。
14.3.1
VAR
模型滞后期的确定
对于
VAR(1)
,
Y
t
?
c
?
?
p>
1
Y
t
?
1
?
?
t
模型稳定的条件是特征方程
?
1
?
?
I
?
0
的根都在单
位圆以内,或相反的特征方程
I
?
L
?
1
?
0
的根都要在单位圆以外。
对于
k>1
的
p>
VAR(k)
模型可以通过矩阵变换改写成分块矩阵的
VAR(1)
模型形式。
Y
t
?
C
?
AY
t
?
1
?
?
t
(
14.9
)
模型稳定的条件是特征方程
A
?
?
I
?
0
的根都在单位圆以内,或其相反的特征方程
|I
-LA|=0
的全部根都在单位圆以外。所以也可以通过估计得到相应
< br>VMA
(
?
)
< br>模型的参数。
这一小节主要介绍的是如何给
VAR
模型确定去合适的滞后期,
在滞后结构中提
供许多确
定滞后期的方法,见图
14.4
。
。
4
欢迎下载
精品文档
图
14.4
VAR
滞后结构视窗对话框
1)AR
根的图表
< br>关于
AR
特征根多项式的倒数可以参考:
L
ü
tkepohl (1991)
< br>。如果
VAR
系统中所有根的
模
的倒数小于
1
,即位于单位圆内,那么
VAR
系统就是稳定的。如果
VAR
系
统不是稳定的,
即部分根的模的倒数位于单位圆外,
那么估计的
某些结果
(
例如,
脉冲响应的标准误差
)
就可
能无效,估计过程中存在
kp
个根,其中
k
表
示内生变量的个数,
p
表示最大滞后期。如果
< br>估计一个带有
r
个协整关系的向量误差修正模型,那么必
须有
k-r
个根的模等于
1
。
根据这一原则,我们得到的估计结果如表
p>
14.1
。
表
14-1
AR
根表
Roots of
Characteristic Polynomial
Endogenous
variables: GDP CPI M1 R
Exogenous variables: C
Lag specification: 1 4
Root
0.992091
0.965850
-0.413574 -
0.711282i
-0.413574 + 0.711282i
0.814673
0.698590 - 0.408019i
0.698590 + 0.408019i
0.356653 - 0.683437i
0.356653 + 0.683437i
-0.168418 - 0.667357i
-0.168418 + 0.667357i
-0.535191
0.478679
-0.255845 -
0.372175i
-0.255845 + 0.372175i
0.290012
Modulus
0.992091
0.965850
0.822779
0.822779
0.814673
0.809016
0.809016
0.770901
0.770901
0.688281
0.688281
0.535191
0.478679
0.451632
0.451632
0.290012
。
5
欢迎下载
精品文档
No root lies outside the unit circle.
VAR satisfies the stability
condition.
从表
14.1
估计的结果可知,所有根的模的倒数都小于
1
,所以估计的
p>
VAR
系统满足稳
定性条件,为了更加直观
的所有根的模的倒数在单位圆中的位置,我们根据
AR
根图来判
断
VAR
系统的稳定性。见图
14.5
。
Inverse Roots
of AR Characteristic Polynomial
1.5
1.0
0.5
0.0
-0
.5
-1.0
-1.5
-1.5
-1.0
-0.5
0.0
0.5
1.0
1.5
图
14.5
AR
根图
根据图
14.5
可知,
所有
AR
根的模的倒数都位于单位圆内,
由此可以判断
V
AR
系统是稳
定的。
如果
VAR
系统是稳定的,
那么进一步进行
VEC
估计的结果就是有效的,
否则某些估计
的结果可能不是有效的。
2)Grange
r
因果检验(
Pairwise Granger
Causality Tests
)
格兰杰因果检验主要是用来检验一个内生变量可否作为一个外生变量对待。对于
VAR<
/p>
系统中的每一个方程,
Eviews
将会
输出每一个内生变量与其他内生变量滞后期的联合
在表格的最后一行
(All)
报告了在这个方程中检验所有滞后内生变量联合
?
2
(Wald)
统计量,
的
?
2
(Wald)
p>
统计量数值。具体见表
14.2
。
表
14.2
VAR
格兰杰因果检验
VAR
Granger Causality/Block Exogeneity Wald Tests
Sample: 1999M01 2006M12
Included observations: 92
Dependent variable: GDP
Excluded
CPI
M1
R
All
Dependent variable: CPI
Excluded
GDP
M1
R
All
Dependent variable: M1
Chi-
sq
20.78732
26.63175
2.464658
68.51009
df
4
4
4
12
Chi-sq
3.724384
59.05509
1.446873
77.94171
df
4
4
4
12
Prob.
0.4446
0.0000
0.8360
0.0000
Prob.
0.0003
0.0000
0.6510
0.0000
。
6
欢迎下载
精品文档
Excluded
GDP
CPI
R
All
Dependent variable: R
Excluded
GDP
CPI
M1
All
Chi-sq
72.08928
33.05300
4.744682
93.10340
Chi-sq
5.450381
0.603649
2.754376
8.353899
df
4
4
4
12
df
4
4
4
12
Prob.
0.0000
0.0000
0.3145
0.0000
Prob.
0.2441
0.9627
0.5997
0.7569
p>
从表
14.2
汇报的结果可以看出内生变量
CPI(
物价水平
)
< br>的滞后期不能很好的解释内生
变量
GDP
(国内生产总值)
,
因此
CP
I
不是
GDP
的格兰杰原因;
同理可以解释其他内生变量。
3)
滞后排除检验(
Lag
Exclusion Tests
)
滞后排除检验是用来检验
VAR
系统中每一个滞后期。对每一个
滞后期,所有内生变量
在特定显著水平下的对于每一个方程的
?
2
(Wald)
统计量被分别单独列出
,最后一列是联合
的显著性检验。具体估计结果见表
14.3<
/p>
。
表
14.3
滞后排除检验结果
VAR Lag
Exclusion Wald Tests
Sample: 1999M01
2006M12
Included observations: 92
Chi-squared test statistics for lag
exclusion:
Numbers in [ ] are p-values
Lag 1
Lag 2
Lag 3
Lag 4
df
GDP
55.14276
[ 3.02e-11]
6.610822
[
0.147940]
28.54094
[ 9.69e-06]
4.828657
[ 0.305334]
4
CPI
130.6234
[ 0.000000]
13.77340
[
0.008055]
3.554922
[ 0.469577]
20.93722
[ 0.000326]
4
M1
80.80588
[ 1.11e-16]
13.61024
[
0.008649]
46.93112
[ 1.58e-09]
29.99224
[ 4.91e-06]
4
R
83.62508
[ 0.000000]
4.540688
[
0.337750]
3.605451
[ 0.462026]
1.837606
[ 0.765595]
4
Joint
377.5179
[
0.000000]
45.89505
[ 0.000101]
70.88551
[ 6.98e-09]
57.63659
[
1.30e-06]
16
从表
14
.3
汇报的结果可以看出,
对于滞后
1
期来说所有内生变量在
0.01
显著水
平下的
每一个方程的都是显著的。
4)
滞后长度准则(
Lag
Length Criteria
)
在理想状态下,
我们希望选择
VAR
的
随机扰动项服从向量白噪音。
所以从理论上说,
如
果能够通过某一种方法选择滞后期数能够使得扰动项满足向量白噪音过程,
那
么滞后期的选
择问题就很好解决了。在
Eviews
里面提供了五种准则来确定滞后期的选择。在选择时,我
们需要设定一个最
大滞后期数,
当然它的设定存在一定的主观性。
但是通常可以根
据数据的
频率来进行确定。例如,对于月度数据一般选择最大滞后期为
< br>6
,
12
和
18
。对于季度数据
。
7
欢迎下载
精品文档
一般选择
< br>4
或者
8
。需要注意不同的准则
或者检验的统计量选择的滞后期可能会有所不同。
在这种状况下,
一般根据多数原则来确定最优滞后期。
这个过程实际上就是所谓的稳健性检
验过程。所有滞后期选择准则的原理可以参见
L
ü
tkepohl (1991, Section 4.3)
。
由具体估
计结果如表
14.4
。
表
14.4
VAR
模型滞后期选择结果
VAR
Lag Order Selection Criteria
Endogenous
variables: GDP CPI M1 R
Exogenous variables: C
Sample: 1999M01 2006M12
Included observations: 90
Lag
0
1
2
3
4
5
6
LogL
312.3743
763.3624
804.8764
828.9678
859.8364
925.3564
959.7743
LR
NA
851.8665
74.72508
41.22313
50.07563
100.4641
49.71468*
FPE
1.24e-08
7.87e-13
4.48e-13
3.76e-13
2.73e-13
9.23e-14
6.29e-14*
AIC
-6.852762
-16.51917
-17.08614
-17.26595
-17.59636
-18.69681
-19.10609*
SC
-6.741659
-14.96365
-16.08622
-14.82162
-14.70762
-16.36365*
-16.32853
HQ
-6.807959
-16.29514
-16.68291
-16.68351
-16.83471
-17.75594
-17.98602*
*
indicates lag order selected by the criterion
LR: sequential modified LR
test statistic (each test at 5% level)
FPE: Final prediction error
AIC: Akaike information criterion
SC: Schwarz information
criterion
HQ: Hannan-Quinn
information criterion
从表
14.4
汇报的结果可知
LR
、
FPE
、
AIC
和
HQ
都指向同样的
6
阶滞
后期,因此应该选
择
VAR(6)
进行
后续分析。
14.3.2
VAR
模型残差检验
VAR
模型估计出来以后,
还必须对其残差进行检验,
以确保估计的结果符合
VAR
的经典
假
设。
Eviews
提供各种检验办法,下面一一进行介绍。
p>
1)
相关图
<
/p>
Eviews
可以显示
VAR
模型在指定的滞后阶数的条件下得到残差成对交叉相关图(样本
自相关)<
/p>
。交叉相关图有三种显示方式,其中有两种表格形式显示:一是根据变量的顺序显
示
(以变量为序的表格形式)
;
另一种是根据滞后阶数的顺序显示
(以滞后阶数的表格形式)
< br>。
最后一种是曲线图显示的交叉相关图矩阵形式。
这些点
线图表示的是加上或者减去滞后性渐
进标准误差的两倍(计算原理是
1/
T
)
。没有超出两本滞后性渐
进标准误差的两倍,就说明
VAR
模型估计的残差不存在交叉相
关。具体操作见图
14.5
。
。
8
欢迎下载
精品文档
图
14.5
通过点击
Corrlograms
以后,会出现如图
14.6<
/p>
的对话框。
图
14.6
为了更加直观,选择用曲
线图显示的形式,选择好滞后阶数以后(这里选择滞后阶数
为
6
期)就可以直接点击
OK
,然后会报告
残差交叉相关情况。具体见图
14.7
。
Autocorrelations with 2 . Bounds
Cor(GDP,GDP(-i))
.3
.2
p>
.1
.0
-.1
-
.2
-.3
1
2
3
4
5
6
.
3
.2
.1
.0
-.1
-.2
-.3
1
2
3
4
5
< br>6
Cor(GDP,CPI(-i))
.3
.2
.1
.0
-.1
-.2
-.3
1
2<
/p>
Cor(GDP,M1(-i))
.3
.
2
.1
.0
-.1
-.2
-.3
3
4
5
6
1
2
Cor(GDP,R(-i))
3
4
5
6
Cor(CPI,GDP(-i))
.3
.2
.1
.0
-.1
-.2
-.3
1
2
3
4
5
6
.3
.2
.1
.0
-.1
-.2
-.
3
1
2
Cor(CPI,CPI(-i
))
.3
.2
.1
.0
-.1
-.2
-.3
3
4
5
6
1
2
Cor(CPI,M1(-i))
.3
.2
.1
.0
-.1
-.2
-.3
3
4
5
6
1
p>
2
Cor(CPI,R(-i))
3
4
5
6
Cor(M1
,GDP(-i))
.3
.2
.1
p>
.0
-.1
-.2
-.3
1
2
3
4
5
6
.3
.
2
.1
.0
-.1
-.2
-.3
1
2
Cor(M1,CPI(-i))
.3
.2
.1
.0
-.1
-.2<
/p>
-.3
3
4
5<
/p>
6
1
2
Cor(
M1,M1(-i))
.3
.2
.1<
/p>
.0
-.1
-.2
-.3
3
4
5
6
1
2
Cor(M1,R(-i))
3
4
5
6
p>
Cor(R,GDP(-i))
.3
.2<
/p>
.1
.0
-.1
-.2
-.3
1
2
3
4
5
6
.3
.2
.1
.0
-.1
-.2
-.3
1
2
Cor(R,CPI(-i))
.3
.2
.1
.0
-.1
p>
-.2
-.3
3
4
5
6
1
2
p>
Cor(R,M1(-i))
.3
.2
p>
.1
.0
-.1
-
.2
-.3
3
4
5
6
1
2
C
or(R,R(-i))
3
4
5
6
图
14.7 <
/p>
从图
14.7
汇报的结果来看,各变量之
间残差不存在交叉相关的情况。如果存在就必须
重新修正设定的模型。
< br>
2)
混合自相关检验
计算与指定阶数所产生的残差序列自相关的多变量
Box-
Pierce/Ljung-Box Q
的统计量
(
详细了解参见:
L
ü
tkepohl, 1991, 4.4.21 & 4.
4.23)
,同时计算出
Q
统计量和调
整的
Q
统计量(带小样本修正)
。在滞
后
h
期不存在序列相关的原假设情况下,两个统计量近似的
p>
。
9
欢迎下载
精品文档
服从自由度为
k
2
(
h
< br>?
p
)
的卡方分布,
其中
p
为
VAR
模型的滞后阶数。
这种渐进分布是近似的,
在某
种意义上,它要求当滞后阶数
i>h-p
时,移动平均项(
p>
MA
)的系数为
0
,因此如果
AR
多项式的根越接近于
1
并且
h
很小时,那么这种渐进分布就不
在近似了,实际上当
h
时,
自由度
将变成负数。
3)
自相关检验
Breusch-Godfrey
LM
检验的原假设是,待检验的序列不存在最多至
m
期的序列相关
性,
即:
H
0
:
?
1
?<
/p>
?
2
?
???<
/p>
?
?
m
?
0
而备选假设是:
H
A
:
p>
至少存在一个
?
j
?
0
,
j
?<
/p>
1,
2,
???
,
m
Breusch-
Godfrey
LM
检验的统计量等于有效样本的大小乘以回
归得到的拟合优度,即:
LM
检验统计统计量
=
T
?
mR
在原假设的情况下,
Breusch-Godfrey LM<
/p>
检验统计量服从自由度为
m
的卡方分布,
一
般情况下,
Breusch-Godfrey LM
检验统计量实际上服从渐进卡方分布,
LM
也在
渐进条件下
有效。
4)
正态检验
这是
J-B
< br>残差正态检验在多变量情况下的扩展,
这种检验主要是比较残差的第三阶、
第
四阶残差矩与来自正态分布的矩。在进行多元正态分布检验之前,需
要选择相互正交的
k
个残差的因式分解。
令
p
为
k
×
k
阶的因式分解矩阵,即:
v
t
?
P
?
p>
t
:
N
(0,
p>
I
k
)
(
14.10
)
其中
?
t
表示衰减残差,定义三阶、四阶矩向量
m
3
?
2
?
v
t
3
t
/
T
和
m
4
?<
/p>
?
v
t
4
/
T
,则
t
T
?
?
?
6
I
k
?
m
< br>3
?
?
N
?
0,
?
?
?
m
4
?
3<
/p>
?
?
?
0
0
?
?
?
?
24
I
k
?
?
在原假设服从正态分
布的情况下,因为每一个残差成分都是相互独立的,所以任何三
阶矩和四阶矩的平方和服
从卡方分布。
Eviews
里面提供
了许多因式分解矩阵
p
的选项,在此不做一一介绍
(
详细情况参加
L
ü
tkepohl 1991, p.
145-148
,
Doornik and Hansen
1994
,
Urzua
1997)
。
5)
怀特异方差检验
这些检验是针对系统方程的
white
’
s
检验的扩展,
由
Kele
jian
(
1982
)
和
Doornik
(
1995
)
提出。这个回归检验是通过残差序列对每一个回归量及回归量
交叉项乘积的回归来实现的,
并且检验回归的显著性。
14.4
VAR
模型具体案例操作及原理
14.4.1
协整检验
.
协整的概念最早是由加州大学圣地亚哥分校计量经济学家
Granger
于
1981
年
提出来
。
10
欢迎下载
精品文档
的,
后来
Engle
和
Granger<
/p>
(
1987
)
,
Engle
和
Yoo
< br>(
1987
,
1991
)
,
Phillips
和
Ouiaris
(
1990
)
,
Stock
和
p>
Watson
(
1988
< br>)
,
Phillips
(
1991
)和
Johansen
(
1988
,
1991
p>
,
1994
)等经济学家
< br>不断完善,
从而使得协整分析成为计量经济学的一个重要分支。
< br>它在宏观经济研究以及金融
市场分析中具有广泛的应用。
协整分析主要应用于短期动态关系容易受到随机扰动的显著影响,
而长期关系又受到均
衡关系制约的经济系统。
例如股票价格与
股息的协整关系,
股票价格容易受到短期市场因素
的影响而容易
波动,
在长期内,
股息主要受到股息政策的约束,表现比较平稳
。在做协整检
验之前要明确变量之间的经济含义,
同时必须强调
变量的经济理论基础,
另外我们进行单方
程回归的时候可能会遇
到“伪回归”的情况。如下列所示:
1985
年至
2004
年,我国的国内生产总值(
GDP
)
,人力资本(
L<
/p>
)
,
固定资产投资(
K
)
的年度数据,如表
14.5<
/p>
。
表
14.5
1985
~
2004
年我国生产函数模型样本观测数据表
年份
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
国内生产总值(
GDP
p>
)
6991.0
7610.6
8491.3
9448.0
9832.2
10209.1
11147.7
12735.1
14452.9
16283.1
17993.7
19718.7
21461.9
23139.9
24792.5
26774.9
28782.6
31170.9
34111.4
37352.0
固定资本存量
(K)
16883.9
18367.6
20140.7
22142.3
23599.7
24906.0
26545.6
29081.2
33082.2
37362.7
41654.5
46245.1
51121.5
56955.4
63126.7
69821.6
77337.1
86362.7
98210.2
112472.4
就业人数
(L)
49873
51282
52783
54334
55329
64749
65491
66142
66808
67455
68065
68950
69820
70637
71394
72085
73025
73740
74432
75412
注:数据来源于《中国统计年鉴
< br>2004
》
利用
1985
~
2004
年我国的相关数据在
Eviews6.0
里面采用普通最小二乘法进行估计下
列生产函数:
LNGDP
t
p>
?
?
0
?
?
1
LNK
t
?
?
2
LNL
t
?
?
t
(
14.11
)
可以得到如下结果:
表
14.6
生产函数估计结果
Dependent Variable: LNGDP
Method: Least Squares
。
11
欢迎下载
精品文档
Variable
LOGK
LOGL
C
R-squared
Adjusted R-squared
S.E. of regression
Sum
squared resid
Log likelihood
F-statistic
Prob(F-statistic)
Coefficient
0.780816
0.569189
-4.888914
Std. Error
0.035329
0.146380
1.406906
t-Statistic
22.10133
3.639774
-3.474941
Prob.
0.0000
0.0020
0.0029
9.703319
0.530959
-3.452692
-3.303332
-3.423535
0.608175
0.994872
Mean dependent var
0.994269
S.D.
dependent var
0.040195
Akaike info criterion
0.027465
Schwarz criterion
37.52692
Hannan-Quinn criter.
1649.222
Durbin-Watson stat
0.000000
从回归的结果来看,
除杜宾统计量偏
低以外,
t
统计量值以及拟合优度
R-
squared
值都很
高,该回归模型除存在自相关以外,
p>
似乎看不出其他任何问题。但是进一步分析表明,
这个
回归模型是一个伪回归。
对伪回归的初步判断可以
根据
Granger
和
Newbold
于
1974
年提出来的经验性规则:当
2
2
R
>DW
时,
所估计的回归就有可能存在伪回归。
在本例中的
R
=0.995>DW=0.608,
这表明,
回归
模型很可能是伪回归,
因此需要对时间序列
LNGDP,LNK
和
LNL
进行单位根检验,
以此来判断时
间序列是否为非平稳序列。
使用下列模型进行单位根检验:
?
x
t
?
p>
?
0
?
?
1
x
t
?
1
?
?
2
< br>t
?
?
t
(
14.12
)
估计的结果如下:
表
14.7
LNGDP
平稳性检验
Null
Hypothesis: LNGDP has a unit root
Exogenous: Constant, Linear Trend
Lag Length: 1 (Automatic based on SIC,
MAXLAG=1)
Augmented Dickey-
Fuller test statistic
Test
critical
values:
1% level
5%
level
10% level
t-Statistic
-3.223796
-4.571459
-3.690814
-3.286909
Prob.*
0.1110
*MacKinnon (1996) one-sided p-values.
表
14.8
LNK
平稳性检验
Null
Hypothesis: LOGK has a unit root
Exogenous: Constant, Linear Trend
Lag Length: 1 (Automatic based on SIC,
MAXLAG=1)
Augmented Dickey-
Fuller test statistic
t-Statistic
-1.690541
Prob.*
0.7131
。
12
欢迎下载
精品文档
Test
critical
values:
1% level
5%
level
10% level
-4.571459
-3.690814
-3.286909
*MacKinnon (1996) one-sided p-values.
表
14.9
LNL
平稳性检验
Null
Hypothesis: LOGL has a unit root
Exogenous: Constant, Linear Trend
Lag Length: 0 (Automatic based on SIC,
MAXLAG=1)
Augmented Dickey-
Fuller test statistic
Test
critical
values:
1% level
5%
level
10% level
t-Statistic
-1.536049
-4.532598
-3.673616
-3.277364
Prob.*
0.7796
*MacKinnon (1996) one-sided
p-values.
通过观测表
1
4.7
至表
14.9
发现时间序列
p>
LNGDP,LNK
和
LNL
均是非平稳的时间序列。由此
可知模型(
14.11
)是三个非平稳时间序列间的回归,因而,标准的
t
值和
F
检验都是无效的,
回归方程是一个伪回归,进一步分析表明,这三个变量的一阶差分序列是平稳的时间序列,
这样我们可以用这三个一阶差分后的平稳时间序列来替代
LNGDP,LNK
和
LNL
,然后进行回归。
如果只是从回归的角度来讲,
这样做是允许的。
但从经济意
义上来讲,
这可能会将某些有丰
富经济意义的和富含价值变量水
平之间的长期关系舍弃。
因为,
大多数经济理论都是以变量
p>
的水平值而不是由一阶差分或者多阶差分形式给出。
这样会出现一个两难的问题:在使用非平稳时间序列建立计量经济模型时,如何既要
< br>防止伪回归的出现,同时又不至于因使用差分序列而舍弃变量间的长期关系?
Gr
anger
和
Enger
于
1987
年共同提出了协整模型有效地解决了这一问题。
< br>
1)
协整检验原理
如果时间序列
X
1
t<
/p>
,
X
2
t
,
???
,
X
kt
都是
d
阶单整序
列,那么存在一个向量
?
?
(
?
1
,
?
2
,
???
,
?
k
)
,
< br>'
'
使得
Z
t
?
?
X
t
:
I
(
d<
/p>
?
b
)
,
其中,
b>0
,
<
/p>
,
则认为时间序列
X
1
t
,
X
2
t
,
???
,
X
kt
X
t
'
?
(
X
p>
1
t
,
X
2
t
,
???
,
X
kt
)
是(
d,b
)阶协整,记为
X
t
:
CI
(
d
,
b
),
?
为协整向量。
协整检验分为量变量协整检验和多变量协整检验,首先介绍两变量协整检验,检验步
骤如下:
(1)
两变量的
Enger-
Granger
检验
为了检验两变量
Y
t
,
X
p>
t
是否协整,
Enger
< br>和
Granger
于
1987<
/p>
年提出了两步检验法。
第一步,用
p>
OLS
方法估计下列方程:
Y
t<
/p>
?
?
X
t
?
?
t
(
14.13
)
得到
Y
t
?
?
X
t<
/p>
<
/p>
(
14.14
)
。
13
欢迎下载
?
?
精品文档
e
t
?<
/p>
Y
t
?
Y
t
(
14.15
)
称为协整回归。
第二步,
检验
e
t
的单整性。
如果
e
t
为稳
定序列,
则认为变量
Y
t
,
X
t
为(
1
,
1
)
阶协整;
如果
e
t
为
1
阶单整,
则认为变量
p>
Y
t
,
X
t
为
(
2
,
1
)
阶协整,
检验
e
t
单整性的方法为
ADF
检验。
下面举例说明两变量
p>
Enger-Granger
检验过程。
我们以
1999
年
1
月至
2006
年
12
月的工业增加值
(GDP)
与物价消费指数
(CPI),GDP
作为因变
量
Y
t
,
CPI
作为自变量
X
t
,所有变量取对数后用最小二乘法在
EVIEWS6.0
< br>进行估计得到的结
果如表
14.10
。
表
14.10
Dependent Variable:LNGDP
Method: Least Squares
Variable
LNCPI
R-squared
Adjusted R-squared
S.E. of regression
Sum
squared resid
Log likelihood
Durbin-Watson stat
Coefficie
nt
1.754336
0.009713
0.169108
Mean
dependent var
0.169108
S.D. dependent var
0.438425
Akaike info criterion
18.26055
Schwarz criterion
-56.55704
Hannan-Quinn criter.
0.069641
Std.
Error
t-Statisti
c
180.6242
0.0000
8.079913
0.480975
1.199105
1.225817
1.209902
Prob.
?
?
?
p>
?
?
?
回归以后点
击
Quick-Genetate
series
…
在对话框的
Enter
equation
里面输入
re=resid
< br>,
点击
OK,
然后双击
,然后会得到回归以后的残差序列,如图
14.8
。
图
14-8
如图
14.8
,点击
View-Unit Root Test
,进行单位根检验得到如下表
14.11
的结果。
。
14
欢迎下载
精品文档
表
14.11
Null Hypothesis: RE
has a unit root
Exogenous: Constant,
Linear Trend
Lag Length: 0 (Automatic
based on SIC, MAXLAG=6)
Test
critical
values:
1% level
5%
level
10% level
t-Statistic
-9.002792
-4.059734
-3.458856
-3.145470
Prob.*
0.0000
Augmented
Dickey-Fuller test statistic
*MacKinnon
(1996) one-sided p-values.
表
14.11
的结果显示,残差序列
re
是稳定序列,因此工业增加值
(GDP)
与物价消费指数
(CPI)
是
(1
,
1)
阶协整。
(2)
多变量协整关系的检验。
上述
Enger-Granger
检验
通常用来检验两变量之间的协整关系,对于多个变量之间的协
整关系,
< br>Johansen
于
1988
年
,
以及与
Juselius
于
1990
年提出了一种极大似然法进行检验的方
法,通常为
Johansen
检验。
协整系统的最大似然估计是对协整系统中的所有独立的协整关系做总体分析,而对系
p>
统中的协整个数并没有事先假定,
同时也不需要对哪个分量的系数进
行规范。
由于多变量协
整的原理在本章开始就已经介绍,
在此不再做过多阐述。
仍然根据表
14-7<
/p>
的数据进行多元协
整的
Johansen
检验。
在进行
Johansen
检验时,需要对各个变量进行单位根检验,由于前面已经介绍,所以
此节就没有列出详细的操作过程,通过单位根检验发现
LNGD
P
、
LNK
和
LNL
满足原序列的一
阶单整,因此可以进行协整检验,具体结
果如表
14.12
。
表
14.12
单位根检验结果
变量
LNGDP
LNK
LNL
D(LNGDP)
D(LNK)
D(LNL)
检验类
型
(c
,
t
,
n)
(c,t,1)
(c,t,1)
(c,t,0)
(c,t,1)
(c,t,1)
(c,t,0)
ADF
统计量
-3.223796
-1.690541
-1.536049
-3.791138
-4.040124
-4.559045
5%
临界值
-3.690814
-3.690814
-3.673616
-3.710482
-3.710482
-3.690814
结论
不平稳
不平稳
不平稳
平稳
平稳
平稳
在进行多元变量协整之前必须打开
v
ar
系统,依次选定
LNGDP
、
p>
LNK
和
LNL
,
右击以后
通过
VAR
系统打开,具体操
作如果
14.9
。
。
15
欢迎下载
-
-
-
-
-
-
-
-
-
上一篇:逆矩阵的求法及逆矩阵的应用
下一篇:SVPWM算法设计_