python 做回归

1 一元线性回归

线性回归是一种简单的模型，但受到广泛应用，比如预测商品价格，成本评估等，都可以用一元线性模型。y = f(x) 叫做一元函数，回归意思就是根据已知数据复原某些值，线性回归（regression）就是用线性的模型做回归复原。

基本思想：已知一批(x, y)来复原另外未知的值，例如（1,1），（2,2），（3,3），那么（4，？），大家很容易知道（4,4），这就是一元线性回归求解问题

import numpy as np

import matplotlib.pyplot as plt

from matplotlib.font_manager import FontProperties

from sklearn.linear_model import LinearRegression

x = [[1], [2],[3], [4], [5], [6]]

y = [[1], [2.1], [2.9], [4.2], [5.1], [5.8]]

model = LinearRegression()

model.fit(x, y)

predicted = model.predict([13])[0]

x2 = [[0], [2.5],[5.3],[7.6],[9.1]]

y2 = model.predict(x2)

print model.score(x2, y2)

print predicted

fonr = FontProperties()

plt.figure()

plt.title("linearRegression")

plt.xlabel('x')

plt.ylabel('y')

plt.axis([0, 10, 0, 10])

plt.grid(True)

plt.pause(0.4)

plt.plot(x , y, 'k.')

plt.plot(x2 , y2, 'g.')

plt.show()

print np.var(x2, ddof = 0)

print model.score(x2, y2)

2 多元线性回归

假设方程为：,求解系数，因为不一定是方阵，所以不能直接求，所以我们对方程两边同乘以,则，由于是方阵，所以两边同时乘以的逆，就可以得到：。

设计二元一次方程：y=1+2x₁+3x₂

取样本为(1,1,1),(1,1,2),(1,2,1)，计算得y=(6,9,8)

注意：这里面常数项1相当于1*x₀，只不过这里的x₀永远取1

X = [[1,1,1],[1,1,2],[1,2,1]]

y = [[6],[9],[8]]

from numpy.linalg import inv

from numpy import dot, transpose

from numpy.linalg import lstsq

x = [[1,1,1], [1,1,2], [1,2,1]]

y = [[6], [9], [8]]

print dot(inv(dot(transpose(x),x)),dot(transpose(x), y))

##===最小二乘法=====================

print lstsq(x, y)[0]

from sklearn.linear_model import LinearRegression

x = [[1,1,1], [1,1,2], [1,2,1]]

y = [[6], [9], [8]]

model = LinearRegression()

model.fit(x, y)

x2 = [[1,3,5]]

y2 = model.predict(x2)

print y2

3 .采用多项式回归

import sys

reload(sys)

sys.setdefaultencoding('utf-8')

import matplotlib.pyplot as plt

import numpy as np

from sklearn.linear_model import LinearRegression#导入线性回归模型

from sklearn.preprocessing import PolynomialFeatures# 导入多项式回归模型

plt.figure()

plt.title('single variable')

plt.xlabel('x')

plt.ylabel('y')

plt.axis([30, 400, 100, 400])

plt.grid(True)

x = [[50], [100], [150], [200], [250], [300]]

y = [[150], [200], [250], [280], [310], [330]]

x_test = [[250], [300]]

y_test = [[310], [330]]

plt.plot(x, y, 'g.',markersize =20)

model = LinearRegression()

x2 = [[30], [400]]

model.fit(x, y)

y2 = model.predict(x2)

plt.plot(x2, y2,label = '$y = ax + c$')

plt.legend()


xx = np.linspace(30, 400, 100)

quadratic_featurizer = PolynomialFeatures(degree = 2)#实例化一个二次多项式

x_train_quadratic = quadratic_featurizer.fit_transform(x)#用二次多项式多样本x做变换

xx_quadratic = quadratic_featurizer.transform(xx.reshape(xx.shape[0], 1))# 把训练好X值的多项式特征实例应用到一系列点上,形成矩阵

regressor_quadratic = LinearRegression()

regressor_quadratic.fit(x_train_quadratic, y)

plt.plot(xx, regressor_quadratic.predict(xx_quadratic),label="$y = ax^2 + bx + c$")
plt.legend()

cubic_featurizer = PolynomialFeatures(degree = 3)

x_train_cubic = cubic_featurizer.fit_transform(x)

xx_cubie = cubic_featurizer.transform(xx.reshape(xx.shape[0], 1))

regressor_cubic = LinearRegression()

regressor_cubic.fit(x_train_cubic, y)

plt.plot(xx, regressor_cubic.predict(xx_cubie),label="$y = a_1x^3 + a_2x^2 + a_3x +c $")

plt.legend()

print '一元线性回归 r-squared', model.score(x_test, y_test)

x_test_quadratic = quadratic_featurizer.transform(x_test)

print '二次性回归 r-squared', regressor_quadratic.score(x_test_quadratic, y_test)

x_test_cubic = cubic_featurizer.transform(x_test)

print '三次线性回归 r-squared', regressor_cubic.score(x_test_cubic, y_test)

plt.show()

python 做回归的更多相关文章

利用Caffe做回归(regression)
Caffe应该是目前深度学习领域应用最广泛的几大框架之一了,尤其是视觉领域.绝大多数用Caffe的人,应该用的都是基于分类的网络,但有的时候也许会有基于回归的视觉应用的需要,查了一下Caffe官网,还 ...
python做量化交易干货分享
http://www.newsmth.NET/nForum/#!article/Python/128763 最近程序化交易很热,量化也是我很感兴趣的一块. 国内量化交易的平台有几家,我个人比较喜欢用的 ...
你用 Python 做过什么有趣的数据挖掘项目？
有网友在知乎提问:「你用 Python 做过什么有趣的数据挖掘项目?」我最近刚开始学习 Python, numpy, scipy 等, 想做一些数据方面的项目,但是之前又没有这方面的经验.所以想知道 ...
使用python做科学计算
这里总结一个guide,主要针对刚开始做数据挖掘和数据分析的同学说道统计分析工具你一定想到像excel,spss,sas,matlab以及R语言.R语言是这里面比较火的,它的强项是强大的绘图功能以及 ...
[翻译]用神经网络做回归(Using Neural Networks With Regression)
本文英文原文出自这里, 这个博客里面的内容是Java开源, 分布式深度学习项目deeplearning4j的介绍学习文档. 简介: 一般来说, 神经网络常被用来做无监督学习, 分类, 以及回归. 也就 ...
12岁的少年教你用Python做小游戏
首页资讯文章频道资源小组相亲登录注册首页最新文章经典回顾开发设计 IT技术职场业界极客创业访谈在国外 - 导航条 - 首页最新文章经典回顾开发 ...
[原创博文] 用Python做统计分析（Scipy.stats的文档）
[转自] 用Python做统计分析 (Scipy.stats的文档) 对scipy.stats的详细介绍: 这个文档说了以下内容,对python如何做统计分析感兴趣的人可以看看,毕竟Python的库也 ...
这几天有django和python做了一个多用户博客系统（可选择模板）
这几天有django和python做了一个多用户博客系统(可选择模板) 没完成,先分享下断断续续2周时间吧,用django做了一个多用户博客系统,现在还没有做完,做分享下,以后等完善了再慢慢说做的 ...
用python做中文自然语言预处理
这篇博客根据中文自然语言预处理的步骤分成几个板块.以做LDA实验为例,在处理数据之前,会写一个类似于实验报告的东西,用来指导做实验,OK,举例: 一,实验数据预处理(python,结巴分词)1.对于爬 ...

随机推荐

wraps装饰器的使用
functools模块中的wraps装饰器说明使用functools模块提供的wraps装饰器可以避免被装饰的函数的特殊属性被更改,如函数名称__name__被更改.如果不使用该装饰器,则会导致函 ...
C++语言中std::array的神奇用法总结，你需要知道！
摘要:在这篇文章里,将从各个角度介绍下std::array的用法,希望能带来一些启发. td::array是在C++11标准中增加的STL容器,它的设计目的是提供与原生数组类似的功能与性能.也正因此, ...
Clickhouse 入门
clickhouse 简介 ck是一个列式存储的数据库,其针对的场景是OLAP.OLAP的特点是: 数据不经常写,即便写也是批量写.不像OLTP是一条一条写大多数是读请求查询并发较少,不适合放置先 ...
JZOJ 2020.10.6 【NOIP2017提高A组模拟9.7】简单无向图
简单无向图题目 Description Input Output Sample Input 输入1: 4 2 1 1 2 输入2: 10 2 2 2 2 1 1 2 1 1 2 Sample Out ...
jenkins.war
一准备工作首先你得打开SSH 二将jenkins.war转移到jenkins.war /usr/local/tomcat/apache-tomcat-7.0.63/webapps/中然后启动tom ...
C#数据结构-二叉树-链式存储结构
对比上一篇文章"顺序存储二叉树",链式存储二叉树的优点是节省空间. 二叉树的性质: 1.在二叉树的第i层上至多有2i-1个节点(i>=1). 2.深度为k的二叉树至多有2k- ...
第8.30节重写Python __setattr__方法实现属性修改捕获
一. 引言在<第8.26节重写Python类中的__getattribute__方法实现实例属性访问捕获>章节介绍了__getattribute__方法,可以通过重写该方法,截获所有通 ...
PyQt（Python+Qt）学习随笔：QTableWidgetItem的位置相关方法
老猿Python博文目录专栏:使用PyQt开发图形界面Python应用老猿Python博客地址 QTableWidgetItem项在QTableWidget中的位置包括三个属性来决定,就是表格部件 ...
PyQt（Python+Qt）学习随笔：QListWidget的currentRow属性
QListWidget的currentRow属性保存当前项的位置,为整型,从0开始计数,在某些选择模式下,当前项可能也是选中项. currentRow属性可以通过方法currentRow().setC ...
PyQt(Python+Qt)学习随笔：Qt Designer中部件的 baseSize和sizeIncrement
1.baseSize 部件的 baseSize是部件的基础大小(单位:像素),如果部件设定了sizeIncrement,该属性用于在调整部件尺寸时计算部件应该调整到的合适值,但这个属性缺省值是QSiz ...