时间序列:

(或称动态数列)是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列。时间序列分析的主要目的是根据已有的历史数据对未来进行预测。(百度百科)

主要考虑的因素

1.长期趋势(Long-term trend) : 时间序列可能相当稳定或随时间呈现某种趋势。

时间序列趋势一般为线性的(linear),二次方程式的 (quadratic)或指数函数(exponential function)。

2.季节性变动(Seasonal variation) 按时间变动,呈现重复性行为的序列。 季节性变动通常和日期或气候有关。 季节性变动通常和年周期有关。

3.周期性变动(Cyclical variation) 相对于季节性变动,时间序列可能经历“周期性变动”。 周期性变动通常是因为经济变动。

4.随机影响(Random effects)

时间序列的预测方法

1.指数平滑法:描述时间序列数据的变化规律和行为,不去试图解释和理解这种变化的原因

2.ARIMA模型:描述时间序列数据的变化规律和行为,它允许模型中包含趋势变动、季节变动、循环变动和随机波动等综合因素影响。具有较高的预测精度,可以把握过去数据变动模式,有助于解释预测变动规律

##################################################################################

在本文中主要介绍指数平滑法在R语言时间序列预测中的应用,最后以实例操作指数平滑法时间序列预测。

##################################################################################

含义:

指数平滑法(Exponential Smoothing,ES)是布朗(Robert G..Brown)所提出,布朗认为时间序列的态势具有稳定性或规则性,所以时间序列可被合理地顺势推延;他认为最近的过去态势,在某种程度上会持续到未来,所以将较大的权数放在最近的资料。

模型分类及适用条件

1.简单指数平滑 适用条件:相加模型,并且处于恒定水平和没有季节性变动的时间序列

X1<-HoltWinters(rainseries, beta=FALSE, gamma=FALSE)

2.霍尔特指数平滑法  适用条件:一个增长或降低趋势的、没有季节性相加模型,X2<-HoltWinters(skirtsseries, gamma=FALSE)

3.Holt-Winters 指数平滑法   适用条件:一个增长或降低趋势并存在季节性可被描述成为相加模型的时间序列。

X3<-HoltWinters(rainseries),其中平滑化依靠三个参数来控制:alpha,beta 和 gamma,分别对应当前时间点上的水平,趋势部分的斜率和季节性部分,参数 alpha,beta 和 gamma

的取值都在 0 和 1 之间,并且当其取值越接近 0 意味着对未来的预测值而言最近的观测值占据相对较小的权重。参数为默认为TRUE,

以上指数平滑只给出原始时间序列所覆盖时期内的预测。但可以通过指定“l.start” 和“b.start” 参数去指定水平和趋势的斜率的初始值。

最后:指数平滑法计算出预测区间,那么预测误差必须是不相关的,而且必须是服从零均值、方差不变的正态分布

实例:以data Market中leading economic indicator数据为例进行分析预测。

1.导入原始数据,并制作时序图进行数据初步判断,代码如下:

library(xlsx)  #导入xlsx包

library(forecast)

library(tseries)

indicator<-read.xlsx(“C:/pythonshu/indicator.xlsx”,1)#导入数据

indicatortimeseries<-ts(indicator,frequency = 12,start =c(2010,1))

plot.ts(indicatortimeseries)#时序图,上升趋势无季节

2.判断为可以使用holt指数模型,故使用holt指数命令进行操作,代码如下:

fithot<-HoltWinters(indicatortimeseries,gamma = FALSE,l.start = 95.1)#指定模型初始值

plot(fithot)#时序图

3.利用构建好的模型进行后10期数据的预测。其中深色为置信区间为95%的预测范围,浅色为80%。

fithot2<-forecast.HoltWinters(fithot,h=10)#预测后10期数据

plot(fithot2)#时序图

4.残差检验:

Box.test(fithot2$residuals,lag=6,type=’Ljung’)#白噪声检验,结果中P值=0.035<0.05,残差为非白噪声序列,说明残差中还蕴含信息,模型可以继续优化

5.模型优化:

用decompose()函数对时间序列进行分解,发现其有明显的上升与季节趋势,故选用Holt-Winters 指数平滑法对其优化。

优化模型及对后12期数据的预测代码:

fithot<-HoltWinters(indicatortimeseries)#指定模型初始值

plot(fithot)#时序图

fithot2<-forecast.HoltWinters(fithot,h=10)#预测后10期数据

plot(fithot2)#时序图

6.对优化后模型的检验:

Box.test(fithot2$residuals,lag=10,type=’Ljung’)#白噪声检验,结果为0.6265>0.05残差为白噪声序列,模型拟合有效

acf(fithot2$residuals,lag.max = 20)#自相关图,非0时不相关

plotForecastErrors <- function(forecasterrors)

{

# make a red histogram of the forecast errors:

mysd <- sd(forecasterrors)

hist(forecasterrors, col=”red”, freq=FALSE)

# freq=FALSE ensures the area under the histogram = 1

# generate normally distributed data with mean 0 and standard deviation mysd

mynorm <- rnorm(10000, mean=0, sd=mysd)

myhist <- hist(mynorm, plot=FALSE)

# plot the normal curve as a blue line on top of the histogram of forecast errors:

points(myhist$mids, myhist$density, type=”l”, col=”blue”, lwd=2)

}

plotForecastErrors(fithot2$residuals)#残差直方图, 预测误差是正态分布,并且均值为零,方差不变。

###########################################################################################

以上就是利用指数平滑构建时间序列预测模型的简单案例,你学会了吗?

部分文献参考:1、百度百科相关词条

2、沈浩老师:时间序列预测技术http://shenhaolaoshi.blog.sohu.com/137698400.html

3, http://www.shujudata.top/基于r语言的时间序列指数模型/

基于R语言的时间序列指数模型的更多相关文章

  1. 基于R语言的ARIMA模型

    A IMA模型是一种著名的时间序列预测方法,主要是指将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型.ARIMA模型根据原序列是否平稳以及 ...

  2. 概率图模型 基于R语言 这本书中的第一个R语言程序

    概率图模型 基于R语言 这本书中的第一个R语言程序 prior <- c(working =0.99,broken =0.01) likelihood <- rbind(working = ...

  3. R语言解读多元线性回归模型

    转载:http://blog.fens.me/r-multi-linear-regression/ 前言 本文接上一篇R语言解读一元线性回归模型.在许多生活和工作的实际问题中,影响因变量的因素可能不止 ...

  4. R语言利用ROCR评测模型的预测能力

    R语言利用ROCR评测模型的预测能力 说明 受试者工作特征曲线(ROC),这是一种常用的二元分类系统性能展示图形,在曲线上分别标注了不同切点的真正率与假正率.我们通常会基于ROC曲线计算处于曲线下方的 ...

  5. Twitter基于R语言的时序数据突变检测(BreakoutDetection)

    Twitter开源的时序数据突变检测(BreakoutDetection),基于无参的E-Divisive with Medians (EDM)算法,比传统的E-Divisive算法快3.5倍以上,并 ...

  6. 基于R语言的梯度推进算法介绍

    通常来说,我们可以从两个方面来提高一个预测模型的准确性:完善特征工程(feature engineering)或是直接使用Boosting算法.通过大量数据科学竞赛的试炼,我们可以发现人们更钟爱于Bo ...

  7. 基于R语言的结构方程:lavaan简明教程 [中文翻译版]

    lavaan简明教程 [中文翻译版] 译者注:此文档原作者为比利时Ghent大学的Yves Rosseel博士,lavaan亦为其开发,完全开源.免费.我在学习的时候顺手翻译了一下,向Yves的开源精 ...

  8. 【转】基于R语言构建的电影评分预测模型

    一,前提准备         1.R语言包:ggplot2包(绘图),recommenderlab包,reshape包(数据处理)         2.获取数据:大家可以在明尼苏达州大学的社会化计算研 ...

  9. 机器学习-线性回归(基于R语言)

    基本概念 利用线性的方法,模拟因变量与一个或多个自变量之间的关系.自变量是模型输入值,因变量是模型基于自变量的输出值. 因变量是自变量线性叠加和的结果. 线性回归模型背后的逻辑——最小二乘法计算线性系 ...

随机推荐

  1. JavaEE 之 Spring(三)

    1.Spring Web MVC a.定义:是一种基于Java的实现了Web MVC设计模式的请求驱动类型的轻量级Web框架,即使用了MVC架构模式的思想,将web层进行职责解耦,基于请求驱动指的就是 ...

  2. CSS-选择器权重计算

    权重计算规则 内联样式,如: style=" ",权值为1000. ID选择器,如:#content,权值为0100. 类,伪类和属性选择器,如.content,权值为0010. ...

  3. 一道有意思的找规律题目 --- CodeForces - 964A

    题目连接: https://vjudge.net/problem/1502082/origin 这一题第一眼看过去貌似是模拟,但是根据其范围是1e9可以知道,如果暴力解基本上是不可能的(不排除大佬级优 ...

  4. BZOJ.4540.[HNOI2016]序列(莫队/前缀和/线段树 单调栈 RMQ)

    BZOJ 洛谷 ST表的一二维顺序一定要改过来. 改了就rank1了哈哈哈哈.自带小常数没办法. \(Description\) 给定长为\(n\)的序列\(A_i\).\(q\)次询问,每次给定\( ...

  5. PowerShell一次执行多条命令

    PowerShell一次执行多条命令语句 使用CMD之后换到PS之后想一次执行多条命令会很不习惯,因为原来的&&语句连接符已经不能用了. 在各种搜索后没有发现网上有说明这个的.无奈只能 ...

  6. BZOJ2647 : [Neerc2011]Journey

    $|x|+|y|=\max(x+y,x-y,-x+y,-x-y)$,设$f[i][j]$表示在$(0,0)$,朝向方向$j$,执行第$i$条指令后的信息: $cir$:是否陷入循环 $d$:朝向 $x ...

  7. BZOJ2130 : 魔塔

    考虑从$0$到$n$枚举$A$的通关楼层. 设$f[i]$表示$B$通关$i$层时$C$最多能得到多少金币,因为金币数非负,所以也可以看作最多通关多少层. 当$A$的通关楼层往上多$1$的时候,这把钥 ...

  8. Django——User-Profile

    Profile作用:User内置的字段不够完善,导致创建的用户信息单一,Profile就是为了对User进行扩展,即丰富用户信息 在models中创建Profile类,添加字段user与User形成O ...

  9. TypeScript语法学习--变量的声明

    JavaScript里相对较新的变量声明方式是let和const.let在很多方面与var是相似的,但是可以帮助大家避免在JavaScript里常见一些问题. const是对let的一个增强,它能阻止 ...

  10. es6冲刺02

    1.Symbol es6新增的数据类型 1)概念 提供一个独一无二的值 let a=Symbol() let b=Symbol() 或 let c=Symbol.for('c') let d=Symb ...