#-*-coding:UTF-8-*-
# Created on 2015年10月20日
# @author: hanahimi
import numpy as np
import random
import matplotlib.pyplot as plt def randData():
# 生成曲线上各个点
x = np.arange(-1,1,0.02)
y = [2*a+3 for a in x] # 直线
# y = [((a*a-1)*(a*a-1)*(a*a-1)+0.5)*np.sin(a*2) for a in x] # 曲线
xa = []; ya = []
# 对曲线上每个点进行随机偏移
for i in range(len(x)):
d = np.float(random.randint(90,120))/100
ya.append(y[i]*d)
xa.append(x[i]*d)
return xa,ya def hypfunc(x,A):
# 输入:x 横坐标数值, A 多项式系数 [a0,a1,...,an-1]
# 返回 y = hypfunc(x)
return np.sum(A[i]*(x**i) for i in range(len(A))) # 使用 θ = (X.T*X + λI)^-1 * X.T * y求解直线参数
# 该函数会在X的前面添加偏移位X0 = 1
def LS_line(X,Y, lam = 0.01):
X = np.array(X)
X = np.vstack((np.ones((len(X),)),X)) # 往上面添加X0
X = np.mat(X).T # (m,n)
Y = np.mat(Y).T # (m,1)
M, N = X.shape
I = np.eye(N, N) # 单位矩阵 theta = ((X.T * X + lam*I)**-1)*X.T*Y # 核心公式
theta = np.array(np.reshape(theta,len(theta)))[0]
return theta # 返回一个一维数组 # 使用随机梯度下降法求解最小二参数:
# alpha 迭代步长(固定步长),epslion 收敛标准
def LS_sgd(X,Y,alpha=0.1, epslion = 0.003):
X = [[1,xi] for xi in X] # 补上偏移量x0
N = len(X[0]) # X的维度
M = len(X) # 样本个数
theta = np.zeros((N,)) # 参数初始值
last_theta = np.zeros(theta.shape) times = 10000
while times > 0:
times -= 1
for i in range(M):
last_theta[:] = theta[:]
for j in range(N):
theta[j] -= alpha * (np.dot(theta,X[i])-Y[i])*X[i][j]
if np.sum((theta - last_theta)**2) <= epslion: # 当前后参数的变化小于一定程度时可以终止迭代
break
return theta # 根据输入值:X向量,即拟合阶数,计算对应的范德蒙矩阵
def vandermonde_matrix(X, Y, order=1):
# 根据数据点构造X,Y的 范德蒙德矩阵
m = len(Y)
matX = np.array([[np.sum([X[i]**(k2+k1) for i in range(m)])
for k2 in range(order+1)] for k1 in range(order+1)])
matY = np.array([np.sum([(X[i]**k)*Y[i] for i in range(m)])
for k in range(order+1)])
theta = np.linalg.solve(matX, matY)
return theta if __name__=="__main__":
pass
X, Y = randData()
theta = vandermonde_matrix(X, Y, order=1)
theta = LS_sgd(X,Y) # 画出数据点与拟合曲线
plt.figure()
plt.plot(X,Y,linestyle='',marker='.')
yhyp = [hypfunc(X[i],theta) for i in range(len(X))]
plt.plot(X, yhyp,linestyle='-')
plt.show()

最小二乘法 python实现的更多相关文章

  1. 批处理最小二乘法 python

    参考:系统辨识与自适应控制MATLAB仿真(修订版) 庞中华 崔红 仿真实例2.5 import numpy as np import matplotlib.pyplot as plt from mx ...

  2. python 最小二乘 leastsq 函数实现 法线式 解决与x轴垂直问题

    当使用y=kx+b时,与x轴垂直的直线无法计算.因此使用法线式ysin(theta)+xcos(theta) = dist.貌似这么用有点复杂了,直接使用ax+by=1不知道能不能计算,未测试. # ...

  3. python 最小二乘 leastsq 函数实现

    代码修改自 http://www.cnblogs.com/NanShan2016/p/5493429.html 网上百度了一下,主要是两个例子,一个利用了多项式函数,一个就是这个.有些细节没看懂,主要 ...

  4. 线性回归linear regression(python脚本实现)

    python机器学习-乳腺癌细胞挖掘(博主亲自录制视频) https://study.163.com/course/introduction.htm?courseId=1005269003&u ...

  5. Andrew 机器学习课程笔记

    Andrew 机器学习课程笔记 完成 Andrew 的课程结束至今已有一段时间,课程介绍深入浅出,很好的解释了模型的基本原理以及应用.在我看来这是个很好的入门视频,他老人家现在又出了一门 deep l ...

  6. 【读书笔记与思考】Andrew 机器学习课程笔记

    Andrew 机器学习课程笔记 完成 Andrew 的课程结束至今已有一段时间,课程介绍深入浅出,很好的解释了模型的基本原理以及应用.在我看来这是个很好的入门视频,他老人家现在又出了一门 deep l ...

  7. python数据分析入门——matplotlib的中文显示问题&最小二乘法

    正在学习<用python做科学计算>,在练习最小二乘法时遇到matplotlib无法显示中文的问题.查资料,感觉动态的加上几条语句是最好,这里贴上全部的代码. # -*- coding: ...

  8. 机器学习:Python中如何使用最小二乘法

    之所以说"使用"而不是"实现",是因为python的相关类库已经帮我们实现了具体算法,而我们只要学会使用就可以了.随着对技术的逐渐掌握及积累,当类库中的算法已经 ...

  9. Python实现实现基于最小二乘法的线性回归

    下面展示利用Python实现基于最小二乘法的线性回归模型,同时不需要引入其他科学计算以及机器学习的库. 利用Python代码表示如下: #首先引入数据集x,和y的值的大小利用Python的数据结构:列 ...

随机推荐

  1. jquery 添加方法 : $.fn.方法名 = function(参数a,b,c){

    $.fn.image_checked = function(self,status,img_body,csrf_token){             $(this).live('click', fu ...

  2. hadoop集群配置实例

    1)ssh配置 http://allthingshadoop.com/2010/04/20/hadoop-cluster-setup-ssh-key-authentication/ 2) 修改打开文件 ...

  3. list集合的遍历3种方法

    package com.sort; import java.util.ArrayList; import java.util.Iterator; import java.util.List; /** ...

  4. Codeforces Round #378 (Div. 2) D题(data structure)解题报告

    题目地址 先简单的总结一下这次CF,前两道题非常的水,可是第一题又是因为自己想的不够周到而被Hack了一次(或许也应该感谢这个hack我的人,使我没有最后在赛后测试中WA).做到C题时看到题目情况非常 ...

  5. net IL的一些探索

    查看IL有2个工具比较好用,一个是大名鼎鼎的Reflector,但已经转向收费,另一个是开源的ILSpy,强大好用,对linq和lambda表达示的支持很好.相关的书籍也很多,比如这本Microsof ...

  6. 过滤器 Filter

    Filter(过滤器)简介 Filter 的基本功能是对发送到 Servlet 的请求进行拦截, 并对响应也进行拦截. Filter 程序是一个实现了 Filter 接口的 Java 类,与 Serv ...

  7. HDU 3341 状态压缩DP+AC自动机

    题目大意: 调整基因的顺序,希望使得最后得到的基因包含有最多的匹配串基因,使得所能达到的智商最高 这里很明显要用状态压缩当前AC自动机上点使用了基因的情况所能达到的最优状态 我最开始对于状态的保存是, ...

  8. Map学习

    1.Query Operations(查询操作) int size();boolean isEmpty(); boolean containsKey(Object key);boolean conta ...

  9. hadoop创建两大错误:Bad connection to FS. command aborted. exception和Shutting down NameNod...

    我的hadoop启动后,各个节点都正常,但是无法查看hdfs目录,错误提示 Bad connection to FS. command aborted.  查了下网上的解决办法,主要是删除tmp下的所 ...

  10. goldengate复制过程字符集处理一例

    源端是oracle, al32utf8,表里有乱码,目标端是sybase cp936,两端的DB都不能改字符集,而且源端是目标端的超集,当复制有乱码的数据(非中文或英文数字等),目标端replicat ...