#

import numpy as np
import pandas as pd
from pandas import Series,DataFrame
import matplotlib.pyplot as plt
from pylab import mpl mpl.rcParams['font.sans-serif'] = ['FangSong'] # 指定默认字体
mpl.rcParams['axes.unicode_minus'] = False # 解决保存图像是负号'-'显示为方块的问题 导入数据各个海滨城市数据--
# 去除没用的列
city_list = [ferrara,torino,mantova,milano,ravenna,asti,bologna,piacenza,cesena,faenza]
for city in city_list:
city.drop('Unnamed: 0',axis=1,inplace=True) #显示最高温度于离海远近的关系(观察多个城市)
city_max_temp = [] #城市
city_dist = [] #距离
for city in city_list:
temp = city['temp'].max()
dist = city['dist'].max()
city_max_temp.append(temp)
city_dist.append(dist)
plt.scatter(city_dist,city_max_temp) #x自变量 y因变量
plt.xlabel('距离')
plt.ylabel('最高温度')
plt.title('最高温度额距离之间的关系')
观察发现,离海近的可以形成一条直线,离海远的也能形成一条直线。 - 分别以100公里和50公里为分界点,划分为离海近和离海远的两组数据(近海:小于100 远海:大于50)
#数据转存到numpy中
city_dist = np.array(city_dist) #任意维度的数组
city_max_temp = np.array(city_max_temp)
#加条件 判断
condition = city_dist < 100 #True False 布尔值
near_city_dist = city_dist[condition] #索引 只拿True对应的值
near_city_temp = city_max_temp[condition] #索引
#下面绘图
plt.scatter(near_city_dist,near_city_temp) #x自变量 y因变量
plt.xlabel('近海距离')
plt.ylabel('近海最高温度')
plt.title('近海城市最高温度额距离之间的关系')

# sklearn

机器学习:
  算法模型 -- 特殊对象.内部已经帮我们集成或者封装好一个某一种算法或者某一种方程(还没有解的方程)
  样本数据 -- 样本对象的数据 帮助方程求出解
    特征数据 -自变量
    目标数据 -因变量
  模型分类
    有监督学习 样本数据必须包含特征数据和目标数据
      -线性回归算法模型
    无监督学习 只包含特征数据
    半监督学习 前期训练 后期预测 (少用)
  算法模型的作用 --
    预测未知
    分类
#特征数据
feature = near_city_dist.reshape(-1,1)
#目标数据
target = near_city_temp
print('真实值',target)
print('预测值',linner.predict(feature))

score 算法

# 导入sklearn 建立线性回归算法模型对象
from sklearn.linear_model import LinearRegression #线性回归 有监督学习
linner = LinearRegression() #实例化s
#求解(训练模型):需要将样本数据(特征,目标) 带入到模型对象中
linner.fit(near_city_dist.reshape(-1,1),near_city_temp) #X 特征数据 只能2维 y:目标 reshape(行 列)
y = linner.predict([[81],[90]]) #调用方程 (X)
linner.score(near_city_dist.reshape(-1,1),near_city_temp) #计算模型分数 #绘制直线(是由点组成)
x = np.linspace(0,80,100)
y = linner.predict(x.reshape(-1,1))
plt.scatter(near_city_dist,near_city_temp)
plt.xlabel('近海城市距离')
plt.ylabel('近海城市最高温度')
plt.title('近海城市最高温度和距离之间的关系')
plt.scatter(x,y)

sklearn 线性回归的更多相关文章

  1. Sklearn线性回归

    Sklearn线性回归 原理 线性回归是最为简单而经典的回归模型,用了最小二乘法的思想,用一个n-1维的超平面拟合n维数据 数学形式 \[y(w,x)=w_0+w_1x_1+w_2x_2+-+w_nx ...

  2. sklearn线性回归实现房价预测模型

    目录 题目要求 单特征线性回归 方案一 方案二 多特征线性回归 两份数据 ex1data1.txt ex1data2.txt 题目要求 建立房价预测模型:利用ex1data1.txt(单特征)和ex1 ...

  3. 『科学计算』通过代码理解线性回归&Logistic回归模型

    sklearn线性回归模型 import numpy as np import matplotlib.pyplot as plt from sklearn import linear_model de ...

  4. Scikit-Learn 机器学习笔记 -- 线性回归、逻辑回归、softma

      import numpy as np from matplotlib import pyplot as plt # 创建线性回归数据集 def create_dataset(): X = 2 * ...

  5. skearn自学路径

    sklearn学习总结(超全面) 关于sklearn,监督学习几种模型的对比 sklearn之样本生成make_classification,make_circles和make_moons pytho ...

  6. Sklearn库例子2:分类——线性回归分类(Line Regression )例子

    线性回归:通过拟合线性模型的回归系数W =(w_1,…,w_p)来减少数据中观察到的结果和实际结果之间的残差平方和,并通过线性逼近进行预测. 从数学上讲,它解决了下面这个形式的问题:      Lin ...

  7. sklearn库 线性回归库 LinearRegression

    import numpy as np import sklearn.datasets #加载原数据 from sklearn.model_selection import train_test_spl ...

  8. 使用sklearn机器学习库实现线性回归

    import numpy as np  # 导入科学技术框架import matplotlib.pyplot as plt  # 导入画图工具from sklearn.linear_model imp ...

  9. sklearn学习笔记之简单线性回归

    简单线性回归 线性回归是数据挖掘中的基础算法之一,从某种意义上来说,在学习函数的时候已经开始接触线性回归了,只不过那时候并没有涉及到误差项.线性回归的思想其实就是解一组方程,得到回归函数,不过在出现误 ...

随机推荐

  1. (转) maven snapshot和release版本的区别

    在使用maven过程中,我们在开发阶段经常性的会有很多公共库处于不稳定状态,随时需要修改并发布,可能一天就要发布一次,遇到bug时,甚至一 天要发布N次.我们知道,maven的依赖管理是基于版本管理的 ...

  2. numpy 中array 和ndrray的区别联系

    numpy.array()  标明array只是一个方法 ndarray 是类名,是一个实例. a=numpy.array(b)    #这是把变量b转换为数组a,这里array()是个方法,a的类型 ...

  3. 二分-A - Cable master

    A - Cable master Inhabitants of the Wonderland have decided to hold a regional programming contest. ...

  4. NG-ALAIN 边学边记1

    在文件夹下右键启动powerShell ng new my-project --skip-npm cd my-project ng add ng-alainnpm installng serve np ...

  5. 【转载】Hadoop生态上几个技术的关系与区别:hive、pig、hbase 关系与区别

    转自:http://www.linuxidc.com/Linux/2014-03/98978.htm Pig 一种操作hadoop的轻量级脚本语言,最初又雅虎公司推出,不过现在正在走下坡路了.当初雅虎 ...

  6. Federal Learning(联邦学习)认知

    本人是学生党,同时也是小菜鸡一枚,撞运气有机会能够给老师当项目助理,在这个过程中肯定会学到一些有趣的知识,就在此平台上记录一下,在知识点方面有不对的还请各位指正. What(什么是联邦学习?) 联邦学 ...

  7. vue-element-admin框架快速入门

    年底了,最近公司也不是太忙,感觉今年互联网行业都遇到寒冬,不在是前两年像热的发烫的赛道.这几天完成公司项目系统的优化和升级,目前准备想开发一套前后端分离的系统.       现在java最新最火的技术 ...

  8. Python获取最新电影的信息

    这次将从电影天堂获取最新的电影的详细信息,这里电影的信息罗列的比较详细. 本来只是想获取电影的迅雷链接,然后用迅雷去下载.但看到这里的电影的信息比较完整和详细,忍不住把所有信息都爬取下来了. 下图是& ...

  9. Spring事务之传播机制

    Spring事务传播机制:Spring在TransactionDefinition接口中规定了种类型的事务传播行为,它们规定了事务方法和事务方法发生嵌套时事务如何进行传播.即协调已经有事务标识的方法之 ...

  10. layui之普通数据表格显示switch选择表单组件

    先看效果: 一般这写什么switch组件,下拉框组件只在表单显示,如果要在其他地方显示就要注意一下细节 默默跳槽一下这个layui,真的蛋疼,每次用它东西都要各种设置东西,无语 接下来看下代码: HT ...