R语言实现金融数据的时间序列分析及建模

一 移动平均

  
移动平均能消除数据中的季节变动和不规则变动。若序列中存在周期变动,则通常以周期为移动平均项数。移动平均法可以通过数据显示出数据长期趋势的变动规律。

  R可用filter()函数做移动平均。用法:filter(data,filter,sides)




1、简单移动平均



  简单移动平均就是将n个观测值的平均数作为第(n
1)/2个的拟合值。当n为偶数时,需进行二次移动平均。简单移动平均假设序列长期趋势的斜率不变。

   以我国1992到2014年的季度GDP数据为例。



data<-read.csv("gdpq.csv")

tdata<-ts(data,start=1992,freq=4)

m1<-filter(tdata,filter=c(rep(1/4,4)))

plot(tdata,xlab="时间",ylab="gdp")

lines(m1,col="red",cex=1.5)




  
代码运行结果如上图,红色表示拟合值,黑色表示真实值。

2、二次移动平均



  
二次移动平均即在一次移动平均的基础上再进行一次移动平均。一般两次移动平均的项数是一致的。二次移动平均假设序列长期趋势的斜率是随时间的变化而变化的。

  
二次移动平均长期趋势的拟合公式为:at=2M1t−M2t,其中M1t
表示第一次移动平均的拟合值,M2t表示二次移动平均的拟合值。

   同样以上述数据为例,进行二次移动平均。代码如下:



plot(tdata,type="l",xlab="时间",ylab="季度GDP")

m2<-filter(m1,filter=c(rep(1/4,4)),sides=1)

lines(2*m1-m2,col="red",cex=2)

   代码运行结果如上图所示,红色为二次移动的拟合值。

二 指数平滑



  
指数平滑的思想与移动平均是一样的,只是随着时间间隔的增加,加权的权重会呈指数衰减。它认为时间间隔越远的数据对当期数据的影响越小。R调用的函数为

HoltWinters(data, alpha=, beta=,
gamma=,seasonal=c(“additive”,”multiple”)…)




1、简单指数平滑



  
简单指数平滑假设序列中不存在季节变动和系统的趋势变化。模型公式为:

Xt=axt (1−a)Xt−1,0a为平滑系数,Xt 为拟合值,xt 为真实值。一般指定X0=x1
,并且a越大,平滑程度越弱。R语言中有函数可以通过最小化一步预测误差平方和的方法估计出a。以2010年到2014年消费者新心指数为例,并预测2015年前6个月的值。代码如下:

>
data<-read.csv("consumer_cf.csv")

>
newdata<-ts(data[,2],start=c(2010,1),freq=12)

>
plot(newdata,type="o",cex.axis=1.5,cex.lab=1.5,

     
xlab="时间",ylab="消费者信心指数")

>
a<-HoltWinters(newdata,beta=F,gamma=F)

>
b<-HoltWinters(newdata,alpha=0.5,beta=F,gamma=F)
#估计参数a

> b

Holt-Winters exponential smoothing without trend and without
seasonal component.



Call:

HoltWinters(x = newdata, alpha = 0.5, beta = F, gamma = F)



Smoothing parameters:

 alpha: 0.5

 beta : FALSE

 gamma: FALSE



Coefficients:

     
[,1]

a 105.2898

>
pdata<-predict(a,6,prediction.interval = T)

>
plot(a,pdata,type="o",xlab="时间",ylab="消费者信心指数")

  
代码运行结果如上所示。用HoltWinters()函数估计出来的a=0.78,且向后预测值为图中红色部分,黑色为真实值。这种预测方法预测出的值往往不够精确,因为它没有考虑序列中存在的其他变动。

2、Holt_Winters指数平滑



  
Holt_Winters指数平滑考虑了序列中存在的季节变动,这种方法对存在季节变动的经济数据有较好的拟合效果,可以用来进行向后预测。

   加法季节模型:

Xt=a∗(xt−st)
(1−a)(at−1
bt−1

bt=β∗(Xt−Xt−1)
(1−β)bt−1

st=γ∗(xt−Xt)
(1−γ)st−p



其中p为季节变动的周期长度。其他含义同上。以上述的GDP数据为例,用HoltWinters指数平滑法分解GDP的水平,斜率及季节变动水平,并预测未来5年的值。代码如下:

> data<-read.csv("gdpq.csv")

>
tdata<-ts(data,start=1992,freq=4)

>
gdp.hw<-HoltWinters(tdata,seasonal="multi")

> plot(gdp.hw$fitted,type="o",main="分解图")

> plot(gdp.hw,type="o")

>
pdata<-predict(gdp.hw,n.ahead=4*5)

> pdata

        
Qtr1    
Qtr2    
Qtr3    
Qtr4

2015 149826.6 168126.7 176640.3 192627.9

2016 161252.4 180708.2 189616.2 206523.1

2017 172678.2 193289.7 202592.1 220418.2

2018 184104.1 205871.2 215568.0 234313.4

2019 195529.9 218452.8 228543.8 248208.5

>
ts.plot(tdata,pdata,type="o",lty=1:2,col=c("red","black"))










  
代码中采用了加法模型。序列的分解图如上图所示。第二个图为模型对数据的拟合图,第三个图的虚线部分为后5年的预测。

R语言实现金融数据的时间序列分析及建模的更多相关文章

  1. [译]用R语言做挖掘数据《二》

    数据探索 一.实验说明 1. 环境登录 无需密码自动登录,系统用户名shiyanlou,密码shiyanlou 2. 环境介绍 本实验环境采用带桌面的Ubuntu Linux环境,实验中会用到程序: ...

  2. R语言分析朝阳医院数据

    R语言分析朝阳医院数据 本次实践通过分析朝阳医院2016年销售数据,得出“月均消费次数”.“月均消费金额”.“客单价”.“消费趋势”等结果,并据此作出可视化图形. 一.读取数据: library(op ...

  3. R语言处理Web数据

    R语言处理Web数据 许多网站提供的数据,以供其用户的消费.例如,世界卫生组织(WHO)提供的CSV,TXT和XML文件的形式的健康和医疗信息报告.基于R程序,我们可以通过编程提取这些网站的具体数据. ...

  4. [译]用R语言做挖掘数据《一》

    介绍 一.实验说明 1. 环境登录 无需密码自动登录,系统用户名shiyanlou,密码shiyanlou 2. 环境介绍 本实验环境采用带桌面的Ubuntu Linux环境,实验中会用到程序: 1. ...

  5. R语言和大数据

    #安装R语言R3.3版本会出现各种so不存在的问题,退回去到R3.1版本时候就顺利安装.在安装R环境之前,先安装好中文(如果没有的话图表中显示汉字成框框了)和tcl/tk包(少了这个没法安装sqldf ...

  6. [译]用R语言做挖掘数据《七》

    时间序列与数据挖掘 一.实验说明 1. 环境登录 无需密码自动登录,系统用户名shiyanlou,密码shiyanlou 2. 环境介绍 本实验环境采用带桌面的Ubuntu Linux环境,实验中会用 ...

  7. [译]用R语言做挖掘数据《六》

    异常值检测 一.实验说明 1. 环境登录 无需密码自动登录,系统用户名shiyanlou,密码shiyanlou 2. 环境介绍 本实验环境采用带桌面的Ubuntu Linux环境,实验中会用到程序: ...

  8. [译]用R语言做挖掘数据《五》

    介绍 一.实验说明 1. 环境登录 无需密码自动登录,系统用户名shiyanlou,密码shiyanlou 2. 环境介绍 本实验环境采用带桌面的Ubuntu Linux环境,实验中会用到程序: 1. ...

  9. [译]用R语言做挖掘数据《四》

    回归 一.实验说明 1. 环境登录 无需密码自动登录,系统用户名shiyanlou,密码shiyanlou 2. 环境介绍 本实验环境采用带桌面的Ubuntu Linux环境,实验中会用到程序: 1. ...

随机推荐

  1. C++设计模式:访客模式

    访客模式:通俗的说, 就是定义一个访问者角色, 当对指定角色进行访问时要通过访问者进行访问. 访客模式的侵入性适中,仅在被访问的类里面加一个对外提供接待访问者的接口. 访客模式的优点: 符合单一职责原 ...

  2. 封装自己的framework静态库

    ios中我们写的代码有时不愿意让别人看到,可能对它进行封装,生成一个静态库如典型的.a,还有一种就是和 苹果自带的库一样的后缀名为.framework的库,个人推荐使用.framework,因为.a不 ...

  3. poj 1564 Sum It Up(dfs)

    Sum It Up Time Limit: 1000MS   Memory Limit: 10000K Total Submissions: 7191   Accepted: 3745 Descrip ...

  4. Ubuntu18 给terminal改个漂亮的命令行提示符

    重新安装了VMware和Ubuntu,但是命令行提示符太单调,不美观,如何更改呢.于是在网上巴拉巴拉搜寻一番. 1.更改PS1环境变量,这俩都可以,我选择第一个: export PS1="\ ...

  5. codeforces 299E Cube Problem

    Cube Problem Time Limit:2000MS Memory Limit:262144KB 64bit IO Format:%I64d & %I64u Submit   Stat ...

  6. Floyd Cycle Detection

    Floyd判圈算法能在O(n)时间复杂度内判断迭代函数或链表中是否有环,并求出环的长度与起点 判断环存在 通常采用快慢指针的方式来判断环是否存在 从绿色起点G开始,快指针每次走2步,慢指针每次走1步, ...

  7. FAT12

    FAT12 is one of FAT file system families,mostly used on 1.44MB floppy disk. FAT 's full name is File ...

  8. import Vue form 'vue' 解释

  9. mobx状态管理快速入门

    1.mobx状态管理   安装: creact-react-app mobx  

  10. RabbitMQ 工作图解

    (转网上的图) (原文地址 ,http://www.cnblogs.com/knowledgesea/p/5296008.html)