机器学习之路: python 线性回归LinearRegression, 随机参数回归SGDRegressor 预测波士顿房价

python3学习使用api

线性回归，和随机参数回归

git: https://github.com/linyi0604/MachineLearning

 from sklearn.datasets import load_boston

 from sklearn.cross_validation import train_test_split

 from sklearn.preprocessing import StandardScaler

 from sklearn.linear_model import LinearRegression, SGDRegressor

 from sklearn.metrics import r2_score, mean_squared_error, mean_absolute_error

 import numpy as np

 # 1 准备数据

 # 读取波士顿地区房价信息

 boston = load_boston()

 # 查看数据描述

 # print(boston.DESCR)   # 共506条波士顿地区房价信息，每条13项数值特征描述和目标房价

 # 查看数据的差异情况

 # print("最大房价：", np.max(boston.target))   # 50

 # print("最小房价：",np.min(boston.target))    # 5

 # print("平均房价：", np.mean(boston.target))   # 22.532806324110677

 x = boston.data

 y = boston.target

 # 2 分割训练数据和测试数据

 # 随机采样25%作为测试 75%作为训练

 x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.25, random_state=33)

 # 3 训练数据和测试数据进行标准化处理

 ss_x = StandardScaler()

 x_train = ss_x.fit_transform(x_train)

 x_test = ss_x.transform(x_test)

 ss_y = StandardScaler()

 y_train = ss_y.fit_transform(y_train.reshape(-1, 1))

 y_test = ss_y.transform(y_test.reshape(-1, 1))

 # 4 使用两种线性回归模型进行训练和预测

 # 初始化LinearRegression线性回归模型

 lr = LinearRegression()

 # 训练

 lr.fit(x_train, y_train)

 # 预测 保存预测结果

 lr_y_predict = lr.predict(x_test)

 # 初始化SGDRRegressor随机梯度回归模型

 sgdr = SGDRegressor()

 # 训练

 sgdr.fit(x_train, y_train)

 # 预测 保存预测结果

 sgdr_y_predict = sgdr.predict(x_test)

 # 5 模型评估

 # 对Linear模型评估

 lr_score = lr.score(x_test, y_test)

 print("Linear的默认评估值为：", lr_score)

 lr_R_squared = r2_score(y_test, lr_y_predict)

 print("Linear的R_squared值为：", lr_R_squared)

 lr_mse = mean_squared_error(ss_y.inverse_transform(y_test),ss_y.inverse_transform(lr_y_predict))

 print("Linear的均方误差为:", lr_mse)

 lr_mae = mean_absolute_error(ss_y.inverse_transform(y_test),ss_y.inverse_transform(lr_y_predict))

 print("Linear的平均绝对误差为:", lr_mae)

 # 对SGD模型评估

 sgdr_score = sgdr.score(x_test, y_test)

 print("SGD的默认评估值为：", sgdr_score)

 sgdr_R_squared = r2_score(y_test, sgdr_y_predict)

 print("SGD的R_squared值为：", sgdr_R_squared)

 sgdr_mse = mean_squared_error(ss_y.inverse_transform(y_test), ss_y.inverse_transform(sgdr_y_predict))

 print("SGD的均方误差为:", sgdr_mse)

 sgdr_mae = mean_absolute_error(ss_y.inverse_transform(y_test), ss_y.inverse_transform(sgdr_y_predict))

 print("SGD的平均绝对误差为:", sgdr_mae)

 '''

 Linear的默认评估值为： 0.6763403830998702

 Linear的R_squared值为： 0.6763403830998701

 Linear的均方误差为: 25.09698569206773

 Linear的平均绝对误差为: 3.5261239963985433

 SGD的默认评估值为： 0.659795654161198

 SGD的R_squared值为： 0.659795654161198

 SGD的均方误差为: 26.379885392159494

 SGD的平均绝对误差为: 3.5094445431026413

 '''

机器学习之路: python 线性回归LinearRegression, 随机参数回归SGDRegressor 预测波士顿房价的更多相关文章

机器学习之路: python k近邻分类器 KNeighborsClassifier 鸢尾花分类预测
使用python语言学习k近邻分类器的api 欢迎来到我的git查看源代码: https://github.com/linyi0604/MachineLearning from sklearn.da ...
机器学习之路：python 集成回归模型随机森林回归RandomForestRegressor 极端随机森林回归ExtraTreesRegressor GradientBoostingRegressor回归预测波士顿房价
python3 学习机器学习api 使用了三种集成回归模型 git: https://github.com/linyi0604/MachineLearning 代码: from sklearn.dat ...
机器学习之路：python k近邻回归预测波士顿房价
python3 学习机器学习api 使用两种k近邻回归模型分别是平均k近邻回归和距离加权k近邻回归进行预测 git: https://github.com/linyi0604/Machine ...
机器学习之路: python 回归树 DecisionTreeRegressor 预测波士顿房价
python3 学习api的使用 git: https://github.com/linyi0604/MachineLearning 代码: from sklearn.datasets import ...
机器学习之路：python支持向量机回归SVR 预测波士顿地区房价
python3 学习使用api 支持向量机的两种核函数模型进行预测 git: https://github.com/linyi0604/MachineLearning from sklearn.dat ...
机器学习之路--Python
常用数据结构 1.list 列表有序集合 classmates = ['Michael', 'Bob', 'Tracy'] len(classmates) classmates[0] len(cla ...
机器学习之路: python 决策树分类DecisionTreeClassifier 预测泰坦尼克号乘客是否幸存
使用python3 学习了决策树分类器的api 涉及到特征的提取,数据类型保留,分类类型抽取出来新的类型需要网上下载数据集,我把他们下载到了本地, 可以到我的git下载代码和数据集: https: ...
机器学习算法的Python实现 (1)：logistics回归与线性判别分析（LDA）
先收藏............ 本文为笔者在学习周志华老师的机器学习教材后,写的课后习题的的编程题.之前放在答案的博文中,现在重新进行整理,将需要实现代码的部分单独拿出来,慢慢积累.希望能写一个机器学 ...
机器学习之路：python线性回归分类器 LogisticRegression SGDClassifier 进行良恶性肿瘤分类预测
使用python3 学习了线性回归的api 分别使用逻辑斯蒂回归和随机参数估计回归对良恶性肿瘤进行预测我把数据集下载到了本地,可以来我的git下载源代码和数据集:https://gith ...

随机推荐

HDU 2058 The sum problem 数学题
解题报告:可以说是一个纯数学题,要用到二元一次和二元二次解方程,我们假设[a,b]这个区间的所有的数的和是N,由此,我们可以得到以下公式: (b-a+1)*(a+b) / 2 = N;很显然,这是一个 ...
24、List三个子类的特点
List的三个子类的特点因为三个类都实现了List接口,所以里面的方法都差不多,那这三个类都有什么特点呢? ArrayList:底层数据结构是数组,查询快,增删慢.线程不安全,效率高. Vector ...
Oracle 11G R2 RAC中的scan ip 的用途和基本原理【转】
Oracle 11G R2 RAC增加了scan ip功能,在11.2之前,client链接数据库的时候要用vip,假如你的cluster有4个节点,那么客户端的tnsnames.ora中就对应有四个 ...
ps查看CPU和内存占用前10的进程
内存增序 ps aux --sort rss 内存减序 ps aux --sort -rss cpu增序 ps auxw --sort=%cpu cpu减序 ps auxw --sort=-%cpu ...
RobotFramework安装扩展库包Selenium2Library（三）
Robot Framework扩展库包 http://robotframework.org/#libraries 一,自动化测试web端 1,pip安装SeleniumLibrary pip inst ...
关于Unity启动时间过长（启动黑屏时间长）的问题!!! 牛逼... 思路不错...
http://blog.csdn.net/u012169685/article/details/52068809
洛谷P2024食物链
传送门啦这道题的特殊之处在于对于任意一个并查集,只要告诉你某个节点的物种,你就可以知道所有节点对应的物种. 比如一条长为4的链甲->乙->丙->丁 ,我们知道乙是A物种.那么甲一 ...
Description Resource Path Location Type The superclass "javax.servlet.http.HttpServlet" was not foun
一段时间没亲自建新项目玩乐,今天建立了一Maven project的时候发现了以下异常,Description Resource Path Location Type The superclass & ...
linux 系统网卡无法识别，缺少驱动
#linux网卡驱动安装# Linux设备加载 #lsmod Module Size Used by e1000e 查看硬件设备 ls /usr/share/hwdata 查看pci网卡设备 lspc ...
sql server中分布式查询随笔(链接服务器(sp_addlinkedserver)和远程登录映射(sp_addlinkedsrvlogin)使用小总结)
由于业务逻辑的多样性,经常得在sql server中查询不同数据库中数据,这就产生了分布式查询的需求现我将开发中遇到的几种查询总结如下: 1.access版本 --建立连接服务器 EXEC sp_a ...

机器学习之路: python 线性回归LinearRegression, 随机参数回归SGDRegressor 预测波士顿房价

机器学习之路: python 线性回归LinearRegression, 随机参数回归SGDRegressor 预测波士顿房价的更多相关文章

随机推荐

热门专题