Robust Locally Weighted Regression 鲁棒局部加权回归 -R实现

鲁棒局部加权回归

【转载时请注明来源】：http://www.cnblogs.com/runner-ljt/

Ljt

作为一个初学者，水平有限，欢迎交流指正。

算法参考文献：

（1） Robust Locally Weighted Regression and Smoothing Scatterplots (Willism_S.Cleveland)

（2）数据挖掘中强局部加权回归算法实现 (虞乐,肖基毅)

R实现

#Robust Locally Weighted Regression 鲁棒局部加权回归

# 一元样本值x,y ;待预测样本点xp ;f局部加权窗口大小（一般取1/3~2/3）;d局部加权回归阶数;

#time鲁棒局部加权回归次数(一般取2就几乎可以满足收敛);

#step梯度下降法固定步长;error梯度下降法终止误差;maxiter最大迭代次数

RobustLWRegression<-function(x,y,xp,f,d,time,step,error,maxiter){

  m<-nrow(x)

  r<-floor(f*m) #窗口内的样本量

  xl<-abs(x-xp)

  xll<-xl[order(xl)]

  hr<-xll[r]  #h为离xp第r个最近的样本到xp的距离

  #三次权值函数(几乎在所有情况下都能够提供充分平滑)

  xk<-(x-xp)/hr

  w<-ifelse(abs(xk)<1,(1-abs(xk^3))^3,0)

  #d次回归函数

  for(i in 2:d){

    x<-cbind(x,x^i)

  }

  x<-cbind(1,x)

  n<-ncol(x)

  #梯度下降法（固定步长）求局部加权回归的系数

  theta<-matrix(0,n,1) #theta 初始值都设置为0

  iter<-0

  newerror<-1

  while((newerror>error)|(iter<maxiter)){

    iter<-iter+1

    h<-x%*%theta

    des<-t(t(w*(h-y))%*%x)      #局部加权梯度

    new_theta<-theta-step*des   #直接设置固定步长

    newerror<-t(theta-new_theta)%*%(theta-new_theta)

    theta<-new_theta

  }

  #time次鲁棒局部加权回归

  for(i in 1:time){

    e<-y-x%*%theta

    s<-median(e)

    #四次权值函数

    xb<-e/(6*s)

    R_w<-ifelse(abs(xb)<1,(1-xb^2)^2,0)

    #梯度下降法求鲁棒加权局部回归

    R_theta<-matrix(0,n,1) #theta 初始值都设置为0

    R_iter<-0

    R_newerror<-1

    while((R_newerror>error)|(R_iter<maxiter)){

      R_iter<-R_iter+1

      R_h<-x%*%R_theta

      R_des<-t(t(w*R_w*(R_h-y))%*%x)    #鲁棒局部加权梯度

      R_new_theta<-R_theta-step*R_des   #直接设置固定步长

      R_newerror<-t(R_theta-R_new_theta)%*%(R_theta-R_new_theta)

      R_theta<-R_new_theta

    }

    theta<-R_theta

  }

  for(i in 2:d){

     xp<-cbind(xp,xp^i)

  }

  xp<-cbind(1,xp)

  yp<-xp%*%theta

  # costfunction<-t(x%*%theta-y)%*%(x%*%theta-y)

  # result<-list(yp,theta,iter,costfunction)

  # names(result)<-c('拟合值','系数','迭代次数','误差')

  # result

  yp

}

实例比较线性回归、局部加权线性回归和鲁棒局部加权线性回归：

>

> t(x)

     [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [,11] [,12] [,13] [,14] [,15]

[1,]   58   59   60   61   62   63   64   65   66    67    68    69    70    71    72

> t(y)

     [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [,11] [,12] [,13] [,14] [,15]

[1,]  111  115  121  123  131  130  140  136  142   145   147   151   148   151   148

>

> lm(y~x)

Call:

lm(formula = y ~ x)

Coefficients:

(Intercept)            x

    -50.245        2.864  

> yy<--50.245+2.864*x

>

> plot(x,y,col='green',pch=20,xlim=c(57,73),ylim=c(109,159))

> lines(x,y,col='green')

> lines(x,yy,col='black')

>

> g<-apply(x,1,function(xp){LWLRegression(x,y,xp,3,1e-7,100000,stepmethod=F,step=0.00001,alpha=0.25,beta=0.8)})

>

> points(x,g,col='blue',pch=20)

> lines(x,g,col='blue')

>

> gg<-apply(x,1,function(xp){RobustLWRegression(x,y,xp,0.6,2,2,0.00000001,1e-7,10000)})

>

> points(x,gg,col='red',pch=20)

> lines(x,gg,col='red')

> legend('bottomright',legend=c('散点图','拟合直线','局部加权散点图','鲁棒局部加权散点图'),lwd=1,col=c('green','black','blue','red'))

>

Robust Locally Weighted Regression 鲁棒局部加权回归 -R实现的更多相关文章

Locally Weighted Regression
简单回顾一下线性回归.我们使用了如下变量:\(x\)—输入变量/特征:\(y\)—目标变量:\((x,y)\)—单个训练样本:\(m\)—训练集中的样本数目:\(n\)—特征维度:\((x^{(i)} ...
局部加权回归LOWESS
1. LOWESS 用kNN做平均回归: \[ \hat{f(x)} = Ave(y_i | x_i \in N_k(x)) \] 其中,\(N_k(x)\)为距离点x最近k个点组成的邻域集合(nei ...
Locally Weighted Linear Regression 局部加权线性回归-R实现
局部加权线性回归 [转载时请注明来源]:http://www.cnblogs.com/runner-ljt/ Ljt 作为一个初学者,水平有限,欢迎交流指正. 线性回归容易出现过拟合或欠拟合的问 ...
Locally weighted regression algorithm
在此引出另一种模型:Locally weighted regression algorithm(LWLR/LWR),通过名字我们可以推断,这是一种更加关注局部变化的模型.的确如此,在普通的linear ...
Locally weighted regression algorithm
之前所讨论的梯度下降算法,其算法模型是“线性回归模型”,我们可以理解为变量与因变量之间的关系是线性的.而现实情况是,使用线性模型去描述所有数据,很容易出现欠拟合(underfitting)的情况:同样 ...
线性回归 Linear regression(4) 局部加权回归
这篇文章将介绍过拟合和欠拟合的概念,并且介绍局部加权回归算法. 过拟合和欠拟合之前在线性回归中,我们总是将单独的x作为我们的特征,但其实我们可以考虑将,甚至x的更高次作为我们的特征,那么我们通过线性 ...
locally weighted regression - CS229
欠拟合和过拟合看下方的三张图第一幅拟合为了 y=θ0+θ1xy=θ0+θ1x 的一次函数第二幅拟合为了y=θ0+θ1x+θ2x2y=θ0+θ1x+θ2x2 的二次函数第三幅拟合为了 y=∑5j ...
Stanford大学机器学习公开课（三）：局部加权回归、最小二乘的概率解释、逻辑回归、感知器算法
(一)局部加权回归通常情况下的线性拟合不能很好地预测所有的值,因为它容易导致欠拟合(under fitting).如下图的左图.而多项式拟合能拟合所有数据,但是在预测新样本的时候又会变得很糟糕,因为 ...
第三集欠拟合与过拟合的概念、局部加权回归、logistic回归、感知器算法
课程大纲欠拟合的概念(非正式):数据中某些非常明显的模式没有成功的被拟合出来.如图所示,更适合这组数据的应该是而不是一条直线. 过拟合的概念(非正式):算法拟合出的结果仅仅反映了所给的特定数据的特质 ...

随机推荐

安卓获取清单文件meta-data数据
<application android:icon="@drawable/ic_launcher" android:label="@string/app_name& ...
Android动态修改ToolBar的Menu菜单
Android动态修改ToolBar的Menu菜单效果图实现实现很简单,就是一个具有3个Action的Menu,在我们滑动到不同状态的时候,把对应的Action隐藏了. 开始上货 Menu Me ...
Android TV开发总结（五）TV上屏幕适配总结
前言:前面几篇总结一些TV上的小Sample,开源到GitHub:https://github.com/hejunlin2013/TVSample, 点击链接,可以持续关注.今天总结下TV上屏幕适配. ...
OpenCV Python 录制视频
调用摄像头引入库支持初始化调整界面大小实时显示录制视频并保存 fourcc问题解决代码实现效果展示总结学到实用OpenCV调用笔记本电脑的摄像头,并录制视频保存到本地硬盘的时候,出现 ...
在Linux环境下实现一个非常好的bash脚本框架
为了方便我日常工作中的编译环境,免去我敲命令行所浪费的时间,我个人写了一个非常有用而又简单的脚本框架,该框架即可以完成的工程源码编译,也可以清除,拷贝等等操作,具体需要开发者自己来实现细节,我的框架思 ...
（九十六）借助APNS实现远程通知、后台任务
APNS全称为Apple Push Notification Service,可以实现在app不启动时也能通过服务器推送到iOS端特定设备的功能. APNS的实现原理为先发送设备的UDID和应用的Bu ...
【OpenGL】理解一些基本问题
写在前面啦啦啦,搞了很久的Unity Shaders,越学越觉得基础知识很重要.学Unity Shader的时候,总会想,shader到底是什么呢?shader的pipeline是什么呢?它们是怎么 ...
Linux内核2.6的进程调度
Linux是多任务抢占操作系统,多任务就是指多个进程间通过分时切换来并发执行.非抢占的系统是对每个进程而言,除非时间片用完或主动放弃否则不会被剥夺CPU,主动放弃包括调用一些调度的系统调用( ...
iOS中 static变量与全局、局部变量的区别 !
static变量与全局.局部变量的区别全局变量(外部变量)的说明之前再冠以static 就构成了静态的全局变量.全局变量本身就是静态存储方式,静态全局变量当然也是静态存储方式. 这两者在存储方式上并 ...
1051. Pop Sequence (25)
题目如下: Given a stack which can keep M numbers at most. Push N numbers in the order of 1, 2, 3, ..., N ...

Robust Locally Weighted Regression 鲁棒局部加权回归 -R实现

Robust Locally Weighted Regression 鲁棒局部加权回归 -R实现的更多相关文章

随机推荐

热门专题