向量自回归模型

今天的你 和昨天的你 和前天的你,是否具有相关性。

1. 定义

向量自回归(VAR,Vector Auto regression)分析联合内生变量间的动态关系
联合:n个变量间的相互影响
动态:p期滞后
没有任何约束条件,因此又称为无约束向量自回归模型

  • VAR方法通过把系统中每一个内生变量,作为系统中所有内生变量的滞后值的函数来构造模型,从而回避了结构化模型的要求。Engle和Granger(1987a)指出两个或多个非平稳时间序列的线性组合可能是平稳的。假如这样一种平稳的或的线性组合存在,这些非平稳(有单位根)时间序列之间被认为是具有协整关系的。这种平稳的线性组合被称为协整方程且可被解释为变量之间的长期均衡关系。
  • VAR模型对于相互联系的时间序列变量系统是有效的预测模型,同时,向量自回归模型也被频繁地用于分析不同类型的随机误差项对系统变量的动态影响。如果变量之间不仅存在滞后影响,而不存在同期影响关系,则适合建立VAR模型,因为VAR模型实际上是把当期关系隐含到了随机扰动项之中

1.1 p阶VAR

\(Y_{t}=C+\Phi_{1} Y_{t-1}+\Phi_{2} Y_{t-2}+\cdots+\Phi_{p} Y_{t-p}+\varepsilon_{t}\)
其中\(Y_{t}=\left[\begin{array}{c}{y_{1 t}} \\ {y_{2 t}} \\ {\vdots} \\ {y_{n t}}\end{array}\right]\)
\(ε_t\)是n×1维的白噪声向量


VAR模型除了研究自身滞后项的影响之外,还研究其他相关因素对未来值产生的影响
\(y_{t}=\beta_{1} \cdot y_{t-1}+\alpha_{1} \cdot x_{t-1}+\beta_{2} \cdot y_{t-2}+\alpha_{2} \cdot x_{t-2}+\ldots\)
其中\(x_{t-1}\)就是其他因素的滞后项。
【详细推导】
因此VAR模型结合了多元时间序列的以及多元回归模型的优点

2 特点

VAR模型不以严格的经济理论为依据因此建模的时候只需要明确两件事
1.哪些变量应该进入模型,变量间应该具有相关关系——格兰杰因果检验
2.滞后阶数p的确定,保证残差刚好不存在自相关
3.var模型对参数不施加零约束(这个不懂)
4.var模型需要估计的参数比较多,当有3个变量,最大滞后阶数p=2时,则有\(2*3^2\)=18个需要估计
5.需要大样本
6.VAR模型的解释变量中不含t期变量
7.没有强制要求所有的变量均为内生变量

补充一个内生变量和外生变量的解释因此VAR模型结合了多元时间序列的以及多元回归模型的优点

3 步骤

3.1 平稳性检验

  • 先检验序列的平稳性,看序列是否平稳,或者一阶单整,或者更高阶;
  • VAR模型要求所有因子数据同阶协整,也就是N个因子里面如果有一个因子数据不平稳,就要全体做差分,一直到平稳为止

3.2 判断滞后阶数

根据AIC SBC等准则选择Var模型的滞后阶数

在VAR模型中解释变量的最大滞后阶数p太小,残差可能存在自相关,并导致参数估计非一致性,适当加大p值。也就是增加滞后变量个数,可消除残差的存在的自相关,但是P值又不能太大,p值过大,直接影响模型参数参数估计的有效性

AIC 最小信息准则和SC施瓦茨准则确定p值,确定p值的方法与原则就是在p值增加的过程中,AIC和SC同时最小

\(\mathrm{AlC}(\mathrm{p})=\operatorname{lndet}\left(\hat{\Sigma}_{p}\right)+\frac{2 n^{2} p}{T}\)
\(\mathrm{BIC}(\mathrm{p})=\operatorname{lndet}\left(\hat{\Sigma}_{p}\right)+\frac{n^{2} p \ln T}{T}\)

n是向量维数,T是样本长度,ph滞后长度,ln表示自然对数,det表示对矩阵求行列式,\((\hat{\Sigma}_{p}\)是当滞后长度为p时,残差向量白噪声协方差矩阵估计

因此对于年度,基督数据,一般比较到p=4,分别建立VAR(1),VAR(2)...VAR(4)模型比较AIC,SC,使它们同时取得最小的p值
对于月度数据一般取到p=12

当AIC,SC的最小值对应不同的p值时,只能用LR检验(这个查下)

定阶完成后就是参数估计,看参数的显著性

1.AR检验,VAR模型特征方程的绝对值的倒数要在单位园里面
2,cusum检验,模型残差积累和在一个区间内波动,不超出区间(不懂)

cusum检验的原假设,系数平稳,北泽假设是不平稳,所以cusum结果是无法拒绝原假设才算通过,只有通过参数稳定性检验的模型才具有预测能力,进行脉冲响应和方差分解才有意义

3.3 VAR模型稳定的条件

对于VAR(1)模型
\(Y_{t}=c+\Pi_{1} Y_{t-1}+u_{t}\)
模型稳定的条件是特征方程\(|\Pi_{1}-{\lambda}I|=0\)的根都在单位圆以内,或者相反的特征方程\(|I-L{\Pi_{1}}|=0\)的根都在单位圆外

对于K>1的VAR模型,可以通过矩阵变化写成分块矩阵的VAR(1)模型
\(Y_{t}=\mathbf{C}+\mathbf{A} Y_{t-1}+\mathbf{U}_{t}\)
模型稳定的条件是特征方程\(|A-{\lambda}I|=0\)在单位圆内,或者与其相反的特征方程在全部根在单位圆外

3.4 协整检验

3.5 格兰杰因果检验

3.6 脉冲响应

看变量对外界的冲击
在实际应用中,由于VAR模型是一种非理论性的模型,它无需对变量做任何先验性的约束,因此在分析VAR模型的时候,往往不分析一个变量的变化对另一个变量的影响如何,而是分析一个误差项发生的变化,或者说模型受到某种冲击时对系统的动态影响

3.7 方差分解

通过分析每一个结构冲击对内生变量变化(通常用方差来衡量)的贡献度,进一步评价不同结构冲击的重要性,因此方差分解给出对VAR模型中的变量产生影响的每个随机扰动的相对重要信息。

VAR模型不是为了回归系数,而是为了方差分解和脉冲响应分析

4 伪回归

若是所建立的回归模型在经济意义上没有因果关系,那么这个就是伪回归,例如路边小树年增长率和国民经济年增长率之间存在很大的相关系数,但是建立的模型却是伪回归。如果你直接用数据回归,那肯定存在正相关,而其实这个是没有意义的回归

5 平稳性检验

单位根检验是序列的平稳性检验,如果不检验序列的平稳性直接OLS容易导致伪回归
因此当检验的数据是平稳的(即不存在单位根),即意思是单位根检验的原假设是存在单位根,存在单位根,则不平稳,等价关系!
要想进一步考察变量的因果联系,可以采用格兰杰因果检验。

5.1 平稳性检验的三个作用

1)检验平稳性,若平稳,做格兰杰检验,非平稳,作协正检验。
2)协整检验中要用到每个序列的单整阶数
3)当检验的数据是非平稳(即存在单位根),并且各个序列是同阶单整(协整检验的前提),想进一步确定变量之间是否存在协整关系,可以进行协整检验,协整检验主要有EG两步法和JJ检验 (1)、EG两步法是基于回归残差的检验,可以通过建立OLS模型检验其残差平稳性 (2)、JJ检验是基于回归系数的检验

单位根检验在R里面需要用到adf.test()函数

5.2 单位根检验

单位根检验是检验数据的平稳性,或是说单整阶数
协整是说两个或多个变量之间具有长期的稳定关系,但变量间协整的必要条件是它们之间是同阶单整,也就是说在进行协整检验之前必须进行单位根检验

协整说的是变量之间存在长期的稳定关系,这只是从数量上得到的结论,但不能确定谁是因,谁是果。而因果关系检验解决的就是这个问题。

单位根检验是检验时间序列是否平稳,协整是在时间序列平稳性的基础上做长期趋势的分析,而格兰杰检验一般是在建立误差修正模型后,所建立的短期的因果关系。故顺序自然是先做单位根检验,再过协整检验,最后是格兰杰因果检验。

单位根检验是对时间序列平稳性的检验,只有平稳的时间序列,才能进行计量分析,否则会出现伪回归现象;
协整是考察两个或者多个变量之间的长期平稳关系;
格兰杰因果检验是考察变量之间的因果关系,协整说明长期稳定关系不一定是因果关系,所以需要在通过格兰杰因果检验确定两者的因果关系。
顺序一般是单位根检验,通过后如果同阶单整,在进行协整,然后在进行因果检验。要特别注意的是:只有同阶单整才能进行协整

6 协整

协整检验是用来分析变量之间的长期均衡关系,在协整分析两变量的过程中,如果自变量和因变量是协整的,我们就可以确信这两变量不会产生伪回归结果并且这两个变量存在长期稳定的关系。

协整的要求或前提是同阶单整

就是说,单整阶数不同的两个或以上的非平稳序列如果一起进行协整检验,必然有某些低阶单整的,即波动相对高阶序列的波动甚微弱(有可能波动幅度也不同)的序列,对协整结果的影响不大,因此包不包含的重要性不大。而相对处于最高阶序列,由于其波动较大,对回归残差的平稳性带来极大的影响,所以如果协整是包含有某些高阶单整序列的话(但如果所有变量都是阶数相同的高阶,此时也被称作同阶单整,这样的话另当别论),一定不能将其纳入协整检验。

7 格兰杰因果

1.格兰杰因果检验是检验统计上的时间先后顺序,并不表示而这真正存在因果关系,是否呈因果关系需要根据理论、经验和模型来判定。

2.关于格兰杰因果检验若X都不是Y的格兰杰原因,这并不是说X与Y之间毫无关系。格兰杰因果检验本身也不是真实意义上检验变量的因果关系,而只是检验变量在统计上的时间先后顺序。

3.格兰杰检验只能用于平稳序列!这是格兰杰检验的前提,而其因果关系并非我们通常理解的因与果的关系,而是说x的前期变化能有效地解释y的变化,所以称其为“格兰杰原因”。

VAR向量自回归模型学习笔记2的更多相关文章

  1. 向量自回归模型VS风险价值模型(VAR&VaR)

    单从外观上看,VAR&VaR两个模型很容易混淆,但就模型方法和用处两者截然不同,R语言作为数据分析的有力工具,其函数包库中包含各种各样的统计模型.通过vars包可以调用向量自回归模型,通过Pe ...

  2. NLP︱高级词向量表达(二)——FastText(简述、学习笔记)

    FastText是Facebook开发的一款快速文本分类器,提供简单而高效的文本分类和表征学习的方法,不过这个项目其实是有两部分组成的,一部分是这篇文章介绍的 fastText 文本分类(paper: ...

  3. JavaScript:学习笔记(7)——VAR、LET、CONST三种变量声明的区别

    JavaScript:学习笔记(7)——VAR.LET.CONST三种变量声明的区别 ES2015(ES6)带来了许多闪亮的新功能,自2017年以来,许多JavaScript开发人员已经熟悉并开始使用 ...

  4. VAR模型学习笔记

    目录 1 定义 VAR模型的具体步骤 建模步骤及公式 代码实现 1 定义 VAR模型除了分析自身滞后项的影响外,还分析其他相关因素的滞后项对未来值产生的影响参考 用来分析随机扰动对系统的动态冲击的大小 ...

  5. box2dweb 学习笔记--sample讲解

    前言: 之前博文"台球游戏的核心算法和AI(1)" 中, 提到过想用HTML5+Box2d来编写实现一个台球游戏. 以此来对比感慨一下游戏物理引擎的巨大威力. 做为H5+box2d ...

  6. GMM高斯混合模型学习笔记(EM算法求解)

    提出混合模型主要是为了能更好地近似一些较复杂的样本分布,通过不断添加component个数,能够随意地逼近不论什么连续的概率分布.所以我们觉得不论什么样本分布都能够用混合模型来建模.由于高斯函数具有一 ...

  7. 学习笔记TF039:TensorBoard

    首先向大家和<TensorFlow实战>的作者说句不好意思.我现在看的书是<TensorFlow实战>.但从TF024开始,我在学习笔记的参考资料里一直写的是<Tenso ...

  8. UFLDL深度学习笔记 (七)拓扑稀疏编码与矩阵化

    UFLDL深度学习笔记 (七)拓扑稀疏编码与矩阵化 主要思路 前面几篇所讲的都是围绕神经网络展开的,一个标志就是激活函数非线性:在前人的研究中,也存在线性激活函数的稀疏编码,该方法试图直接学习数据的特 ...

  9. Three入门学习笔记整理

    一.官方网站:https://threejs.org 二.关于Three.js 三.开始 四.实例 基本结构 结果 五.概念 坐标系 场景 相机 灯光 3D模型 六.简单动画 七.交互控制 结束 # ...

随机推荐

  1. 研究微信红包分配算法之Golang版

    今天来看一下红包的分配,参考几年前流传的微信红包分配算法,今天用Golang实现一版,并测试验证结果. 微信红包的随机算法是怎样实现的?https://www.zhihu.com/question/2 ...

  2. Imagine— 让图片再小一点点

    文章选自我的博客:https://blog.ljyngup.com/archives/267.html/ 再次祭出神奇的Github 这次给大家介绍的是一款神奇的图片压缩软件,以质量的微小损失换取大量 ...

  3. Nginx之美多商城前台部署

    这里我们采用动静分离的方式来部署美多商城项目. 动态请求:采用uwsgi与Django进行通信处理动态业务. 静态请求:采用Ngins通过socket与uwsgi进行通信处理静态业务. 第一步:实现u ...

  4. linux 统计文件夹下文件,文件夹,所有个数

    统计某文件夹下文件的个数 ls -l |grep "^-"|wc -l 统计某文件夹下目录的个数 ls -l |grep "^d"|wc -l 统计文件夹下文件 ...

  5. KVM性能优化之CPU优化

    前言 任何平台根据场景的不同,都有相应的优化.不一样的硬件环境.网络环境,同样的一个平台,它跑出的效果也肯定不一样.就好比一辆法拉利,在高速公路里跑跟乡村街道跑,速度和激情肯定不同... 所以,我们做 ...

  6. MySQL中的索引、左连接、右连接、join、sql执行顺序

    逻辑架构: 1.连接层 2.服务层 3.引擎层(插拔式) 4.存储层 存储引擎: 常用的有:MyISAM.InnoDB 查看命令:show variables like '%storage_engin ...

  7. C#模拟POST上传文件帮助类(支持https、http)

    public static int PostFile(string getUrl, CookieContainer cookieContainer, HttpHeader header, string ...

  8. java设计模式--迪米特法则

    基本介绍 1.一个对象应该对其他对象保持最少的了解 2.类与类关系越密切,耦合度越大 3.迪米特法则又叫最少知道原则,即一个类对自己依赖的类知道的越少越好.也就是说,对于被依赖的类不管多么复杂,都尽量 ...

  9. centos5,6 系统启动流程

    linux内核特点: 支持模块化:模块文件的名字以.ko(kernel object)结尾 支持内核运行时,动态加载和卸载模块文件. linux内核组成部分: 核心文件:/boot/vmlinuz-V ...

  10. C#中WinFrom保存文件SaveFileDialog类的使用方法

    C#中WinFrom保存文件SaveFileDialog类的使用方法 使用的命名空间是:System.Windows.Forms; 常用属性:   Title:保存对话框的标题,默认为"另存 ...