机器学习之路: python 回归树 DecisionTreeRegressor 预测波士顿房价

python3 学习api的使用

git: https://github.com/linyi0604/MachineLearning

代码：

 from sklearn.datasets import load_boston

 from sklearn.cross_validation import train_test_split

 from sklearn.preprocessing import StandardScaler

 from sklearn.tree import DecisionTreeRegressor

 from sklearn.metrics import r2_score, mean_squared_error, mean_absolute_error

 import numpy as np

 '''

 回归树：

     严格上说 回归树不能算是回归

     叶子节点是一团训练数据的均值 不是连续 具体的预测值

     解决特征非线性的问题

     不要求特征标准化和统一量化

     容易过于复杂丧失泛化能力

     稳定性较差，细微改变会导致树结构发生重大变化

 '''

 # 1 准备数据

 # 读取波士顿地区房价信息

 boston = load_boston()

 # 查看数据描述

 # print(boston.DESCR)   # 共506条波士顿地区房价信息，每条13项数值特征描述和目标房价

 # 查看数据的差异情况

 # print("最大房价：", np.max(boston.target))   # 50

 # print("最小房价：",np.min(boston.target))    # 5

 # print("平均房价：", np.mean(boston.target))   # 22.532806324110677

 x = boston.data

 y = boston.target

 # 2 分割训练数据和测试数据

 # 随机采样25%作为测试 75%作为训练

 x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.25, random_state=33)

 # 3 训练数据和测试数据进行标准化处理

 ss_x = StandardScaler()

 x_train = ss_x.fit_transform(x_train)

 x_test = ss_x.transform(x_test)

 ss_y = StandardScaler()

 y_train = ss_y.fit_transform(y_train.reshape(-1, 1))

 y_test = ss_y.transform(y_test.reshape(-1, 1))

 # 4 使用回归树进行训练和预测

 # 初始化k近邻回归模型 使用平均回归进行预测

 dtr = DecisionTreeRegressor()

 # 训练

 dtr.fit(x_train, y_train)

 # 预测 保存预测结果

 dtr_y_predict = dtr.predict(x_test)

 # 5 模型评估

 print("回归树的默认评估值为：", dtr.score(x_test, y_test))

 print("平回归树的R_squared值为：", r2_score(y_test, dtr_y_predict))

 print("回归树的均方误差为:", mean_squared_error(ss_y.inverse_transform(y_test),

                                            ss_y.inverse_transform(dtr_y_predict)))

 print("回归树的平均绝对误差为:", mean_absolute_error(ss_y.inverse_transform(y_test),

                                                ss_y.inverse_transform(dtr_y_predict)))

 '''

 回归树的默认评估值为： 0.7066505912533438

 平回归树的R_squared值为： 0.7066505912533438

 回归树的均方误差为: 22.746692913385836

 回归树的平均绝对误差为: 3.08740157480315

 '''

机器学习之路: python 回归树 DecisionTreeRegressor 预测波士顿房价的更多相关文章

机器学习之路: python 决策树分类DecisionTreeClassifier 预测泰坦尼克号乘客是否幸存
使用python3 学习了决策树分类器的api 涉及到特征的提取,数据类型保留,分类类型抽取出来新的类型需要网上下载数据集,我把他们下载到了本地, 可以到我的git下载代码和数据集: https: ...
机器学习实战---决策树CART回归树实现
机器学习实战---决策树CART简介及分类树实现一:对比分类树 CART回归树和CART分类树的建立算法大部分是类似的,所以这里我们只讨论CART回归树和CART分类树的建立算法不同的地方.首先,我 ...
机器学习之路：python 集成回归模型随机森林回归RandomForestRegressor 极端随机森林回归ExtraTreesRegressor GradientBoostingRegressor回归预测波士顿房价
python3 学习机器学习api 使用了三种集成回归模型 git: https://github.com/linyi0604/MachineLearning 代码: from sklearn.dat ...
机器学习之路：python k近邻回归预测波士顿房价
python3 学习机器学习api 使用两种k近邻回归模型分别是平均k近邻回归和距离加权k近邻回归进行预测 git: https://github.com/linyi0604/Machine ...
机器学习之路: python 线性回归LinearRegression, 随机参数回归SGDRegressor 预测波士顿房价
python3学习使用api 线性回归,和随机参数回归 git: https://github.com/linyi0604/MachineLearning from sklearn.datasets ...
机器学习之路: python k近邻分类器 KNeighborsClassifier 鸢尾花分类预测
使用python语言学习k近邻分类器的api 欢迎来到我的git查看源代码: https://github.com/linyi0604/MachineLearning from sklearn.da ...
机器学习之路--Python
常用数据结构 1.list 列表有序集合 classmates = ['Michael', 'Bob', 'Tracy'] len(classmates) classmates[0] len(cla ...
chapter02 回归模型在''美国波士顿房价预测''问题中实践
#coding=utf8 # 从sklearn.datasets导入波士顿房价数据读取器. from sklearn.datasets import load_boston # 从sklearn.mo ...
【机器学习】迭代决策树GBRT（渐进梯度回归树）
一.决策树模型组合单决策树C4.5由于功能太简单,并且非常容易出现过拟合的现象,于是引申出了许多变种决策树,就是将单决策树进行模型组合,形成多决策树,比较典型的就是迭代决策树GBRT和随机森林RF. ...

随机推荐

HDU 1561 The more, The Better (有依赖背包 || 树形DP)
题目链接 Problem Description ACboy很喜欢玩一种战略游戏,在一个地图上,有N座城堡,每座城堡都有一定的宝物,在每次游戏中ACboy允许攻克M个城堡并获得里面的宝物.但由于地理位 ...
vi的复制粘贴命令 -- （转）
vi编辑器有3种模式:命令模式.输入模式.末行模式.掌握这三种模式十分重要: 1.命令模式:vi启动后默认进入的是命令模式,从这个模式使用命令可以切换到另外两种模式,同时无论在任何模式下只要按一下[E ...
采用dlopen、dlsym、dlclose加载动态链接库【总结】【转】
转自:https://www.cnblogs.com/Anker/p/3746802.html 1.前言为了使程序方便扩展,具备通用性,可以采用插件形式.采用异步事件驱动模型,保证主程序逻辑不变,将 ...
Flask--wtforms快速使用和表单验证(附示例)
一.Form类表单提供WTForms中最高级别的API.它们包含您的字段定义,委托验证,获取输入,聚合错误,并且通常用作将所有内容组合在一起的粘合剂. class wtforms.form.Form ...
栈应用之背包问题（Python 版）
栈应用之背包问题背包问题描述:一个背包里可以放入重量为weight的物品,现有n件物品的集合s,其中物品的重量为别为w0,w1,...,wn-1.问题是能否从中选出若干件物品,其重量之和正好等于w ...
geoserver 启动闪退
跟JDK版本有关: 比如geoserver2.11需要JDK版本为JDK1.8 windows配置两个jdk环境: 网上有方法,但如果只需要满足geoserver的话,可以只安装jdk(注意jdk和j ...
【小程序开发】上拉加载更多demo
wxml: <scroll-view class='swiper-scroll' scroll-y="{{true}}" bindscrolltolower="lo ...
js写的一些通用方法
Js获取当前浏览器支持的transform兼容写法 // 获取当前浏览器支持的transform兼容写法 function getTransfrom() { var transform = '', / ...
表格中border-collapse属性
页面制作中最头痛的,表格的边框算是其一了.一不小心就会出现双重线 border-collapse属性很好的解决了纠结了很久的问题 .table{border: 1px solid #ccc;bord ...
HTML5 Differences from HTML4
Abstract "HTML5 Differences from HTML4" describes the differences of the HTML5 specificati ...

机器学习之路: python 回归树 DecisionTreeRegressor 预测波士顿房价

机器学习之路: python 回归树 DecisionTreeRegressor 预测波士顿房价的更多相关文章

随机推荐

热门专题