R语言预测实战（第一章）

本例使用forecast包中自带的数据集wineind，它表示从1980年1月到1994年8月，

由葡萄酒生产商销售的容量不到1升的澳大利亚酒的总量。数据示意如下：

#观察曲线簇

len=1993-1980+1

data0=wineind[1:12*len]

range0=range(data0)+c(-100,100)

plot(1:12,1:12,ylim=range0,col='white',xlab="月份",ylab="销量")

for(i in 1:len)

{

  points(1:12,wineind[(12*(i-1)+1):(12*i)])

  lines(1:12,wineind[(12*(i-1)+1):(12*i)],lty=2)

}

#对数据按指定格式进行转换

Month=NULL

DstValue=NULL

RecentVal1=NULL

RecentVal4=NULL

RecentVal6=NULL

RecentVal8=NULL

RecentVal12=NULL

#替换掉太大或太小的值

wineind[wineind<18000]=18000

wineind[wineind>38000]=38000

for(i in (12+1):(length(wineind)-1))

{

  Month<-c(Month,i%%12+1)

  DstValue<-c(DstValue, wineind[i+1])

  RecentVal1<-c(RecentVal1,wineind[i])

  RecentVal4<-c(RecentVal4,wineind[i-3])

  RecentVal6<-c(RecentVal6,wineind[i-5])

  RecentVal8<-c(RecentVal8,wineind[i-7])

  RecentVal12<-c(RecentVal12,wineind[i-11])

}

preData=data.frame(Month,DstValue,RecentVal1,RecentVal4,RecentVal6,RecentVal8,RecentVal12)

head(preData)

##Month DstValue RecentVal1 RecentVal4 RecentVal6 RecentVal8 RecentVal12

## 1     2    18000      18000      22591      23739      19227       18000

## 2     3    20008      18000      26786      21133      22893       20016

## 3     4    21354      20008      29740      22591      23739       18000

## 4     5    19498      21354      18000      26786      21133       18019

## 5     6    22125      19498      18000      29740      22591       19227

## 6     7    25817      22125      20008      18000      26786       22893

#画出散点矩阵图

plot(preData)

#使用DstValue与RecentVal12拟合线性模型

lm.fit=lm(DstValue~RecentVal12,data=preData)

cook<-cooks.distance(lm.fit)  #通过cooks.distance函数计算每行记录对模拟的影响度量

plot(cook)

abline(h=0.15,lty=2,col='red')

cook[cook>0.15]

preData=preData[-c(123,79),]

#根据上一步输出的基础数据，提取150行作为训练数据，剩下的做测试数据

#分离训练集与测试集

trainData=preData[1:150,]

testData=preData[151:163,]

#建立模型

lm.fit<-lm(DstValue ~ Month + RecentVal1 + RecentVal4 +

             RecentVal6 + RecentVal8 + RecentVal12,data=trainData)

summary(lm.fit)

#在所有的非线性方法中，多项式比较适合单个变量的衍生变换

#对Month、RecentVal4、RecentVal8三个变量按5次多项式进行衍生

lm.fit<-lm(DstValue~Month+I(Month^2)+I(Month^3)+I(Month^4)+

             I(Month^5)+RecentVal1+RecentVal4+I(RecentVal4^2)+

             I(RecentVal4^3)+I(RecentVal4^4)+I(RecentVal4^5)+

             RecentVal6+RecentVal8+I(RecentVal8^2)+I(RecentVal8^3)+

             I(RecentVal8^4)+I(RecentVal8^5)+RecentVal12,data=trainData)

summary(lm.fit)

#由于涉及到变量太多，使用逐步回归删除掉影响小的变量

lm.fit<-step(lm.fit)

summary(lm.fit)

#去掉P值较大的三个变量I(RecentVal4^3)、I(RecentVal4^4)、

#I(RecentVal4^5)后，再拟合一次模型

lm.fit<-lm(formula=DstValue~Month+I(Month^4)+I(Month^5)+RecentVal6+

             RecentVal8+I(RecentVal8^2)+I(RecentVal8^3)+I(RecentVal8^4)+

             I(RecentVal8^5)+RecentVal12,data=trainData)

#lm.fit就是我们建立的用于时间序列预测的线性回归模型

summary(lm.fit)

#预测及误差分析

#用lm.fit作为预测模型，对预测数据源testData进行预测

#对新数据进行预测

testData$pred=predict(lm.fit,testData)

#计算百分误差率

testData$diff=abs(testData$DstValue-testData$pred)/testData$DstValue

testData

summary(testData)

R语言预测实战（第一章）的更多相关文章

R语言预测实战（第二章--预测方法论）
2.1预测流程从确定预测主题开始,一次进行数据收集.选择方法.分析规律.建立模型.评估效果直到发布模型. 2.2.1确定主题 (1)指标:表达的是数量特征,预测的结果也通常是通过指标的取值来体现. ...
R语言预测实战(游浩麟)笔记1
预测流程确定主题.指标.主体.精度.周期.用户.成本和数据七要素. 收集数据.内容划分.收集原则. 选择方法.主要方法有自相关分析.偏相关分析.频谱分析.趋势分析.聚类分析.关联分析.相关分析.互相 ...
R语言预测实战(游浩麟)笔记2
特征构建技术特征变换,对原始的某个特征通过一定的规则或映射得到新特征的方法,主要方法包括概念分层.标准化.离散化.函数变换以及深入表达.特征变换主要由人工完成,属于比较基础的特征构建方法. 概念分层 ...
使用R语言预测产品销量
使用R语言预测产品销量通过不同的广告投入,预测产品的销量.因为响应变量销量是一个连续的值,所以这个问题是一个回归问题.数据集共有200个观测值,每一组观测值对应一种市场情况. 数据特征 TV:对于一 ...
Spring实战第一章学习笔记
Spring实战第一章学习笔记 Java开发的简化为了降低Java开发的复杂性,Spring采取了以下四种策略: 基于POJO的轻量级和最小侵入性编程: 通过依赖注入和面向接口实现松耦合: 基于切面 ...
activiti实战--第一章--认识Activiti
学习资料:<Activiti实战> 第一章认识Activiti 内容概览:讲解activiti的特点.接口概览.架构等基本信息. 1.3 Activiti的特点 1.使用mybatis ...
Spring3实战第一章 Aop 切面 XML配置
刚看spring3实战书籍第一章切面以前没有关注过现在看到了随手试验一下 AOP AOP(Aspect Oriented Programming),即面向切面编程,可以说是OOP(Objec ...
2017.2.20 activiti实战--第一章--认识Activiti
学习资料:<Activiti实战> 第一章认识Activiti 内容概览:讲解activiti的特点.接口概览.架构等基本信息. 1.3 Activiti的特点 1.使用mybatis ...
核心系统命令实战第一章Linux命令行简介
第一章Linux命令行简介 1.1 Linux命令行概述 1.1.1 Linux 命令行的开启和退出开启:登陆账号密码进入系统退出:exit/logout 快捷键:Ctrl+d 1.1.2 Li ...

随机推荐

Centos7最小安装化后安装图形界面
首先需要对系统进行更新 yum -y upgrade 然后安装桌面组件包 ,在命令行下输入下面的命令来安装 Gnome 包 yum groupinstall "GNOME Desktop&q ...
WinForm 皮肤，自定义控件WinForm.UI
WinForm.UI https://github.com/YuanJianTing/WinForm.UI WinForm 皮肤,自定义控件使用方式: BaseForm: public partia ...
request.getParameter
request.getParameter(),该API针对的是 form表单entype的值为 application/x-www-form-urlencoded(默认值), 或者参数跟在地址栏上us ...
layui中获取全部提交的数据
<form class="layui-form" action="">...........input textarea ......</fo ...
006/搭建fabric(二)
准备vmware虚拟机,并安装完ubuntu系统后.继续搭建fabric运行环境... 0.打开终端,切换root身份.目的:后续操作即可不用sudo... 右键->open Terminal- ...
github创建仓库，往github上上传自己的项目
k第一步: 在github上创建仓库第二步: 创建一个新的项目,填写项目名称,描述创建完成之后,跳转到下面的页面,下面红框中的网址要记住,在后面上传代码的时候需要使用这个地址必须要记住!!! 第 ...
levelDB SSTable-静态布局结构
SSTable是Bigtable中至关重要的一块,对于LevelDB来说也是如此,对LevelDB的SSTable实现细节的了解也有助于了解Bigtable中一些实现细节. 本节内容主要讲述S ...
Spring IoC，IoC原理
一.IoC概念及原理 IOC的别名:依赖注入(DI) 2004年,Martin Fowler探讨了同一个问题,既然IOC是控制反转,那么到底是“哪些方面的控制被反转了呢?”,经过详细地分析和论证后,他 ...
spring aop实现数据库的读写分离
为了减轻数据库的压力,一般会使用数据库主从(master/slave)的方式,但是这种方式会给应用程序带来一定的麻烦,比如说,应用程序如何做到把数据写到master库,而读取数据的时候,从slave库 ...
k3 cloud中获取自己开发的单据
设置基础资料(业务对象).系统自带用单据

R语言预测实战（第一章）

R语言预测实战（第一章）的更多相关文章

随机推荐

热门专题