机器学习之路： python 实践提升树 XGBoost 分类器

git: https://github.com/linyi0604/MachineLearning

数据集被我下载到本地，可以去我的git上拿数据集

XGBoost
提升分类器
属于集成学习模型
把成百上千个分类准确率较低的树模型组合起来
不断迭代,每次迭代生成一颗新的树

下面对泰坦尼克遇难预测
使用XGBoost模型和其他分类器性能进行比较

 import pandas as pd

 from sklearn.cross_validation import train_test_split

 from sklearn.feature_extraction import DictVectorizer

 from sklearn.ensemble import RandomForestClassifier

 from xgboost import XGBClassifier

 '''

 XGBoost

 提升分类器

     属于集成学习模型

     把成百上千个分类准确率较低的树模型组合起来

     不断迭代,每次迭代生成一颗新的树

 下面 对泰坦尼克遇难预测

 使用XGBoost模型 和 其他分类器性能进行比较

 '''

 titanic = pd.read_csv("../data/titanic/titanic.txt")

 # 抽取pclass age 和 sex 作为训练样本

 x = titanic[["pclass", "age", "sex"]]

 y = titanic["survived"]

 # 采集的age空的用平均数补全

 x["age"].fillna(x["age"].mean(), inplace=True)

 # 分割训练数据和测试数据

 x_train, x_test, y_train, y_test = train_test_split(x,

                                                     y,

                                                     test_size=0.25,

                                                     random_state=33)

 # 提取字典特征 进行 向量化

 vec = DictVectorizer()

 x_train = vec.fit_transform(x_train.to_dict(orient="record"))

 x_test = vec.transform(x_test.to_dict(orient="record"))

 # 采用默认配置的随机森林进行预测

 rfc = RandomForestClassifier()

 rfc.fit(x_train, y_train)

 print("随机森林预测准确率:", rfc.score(x_test, y_test))  # 0.7811550151975684

 # 采用XGBoost模型进行预测

 xgbc = XGBClassifier()

 xgbc.fit(x_train, y_train)

 print("XGBoost预测准确率:", xgbc.score(x_test, y_test))  # 0.7872340425531915

机器学习之路： python 实践提升树 XGBoost 分类器的更多相关文章

机器学习算法与Python实践之（四）支持向量机（SVM）实现
机器学习算法与Python实践之(四)支持向量机(SVM)实现机器学习算法与Python实践之(四)支持向量机(SVM)实现 zouxy09@qq.com http://blog.csdn.net/ ...
机器学习算法与Python实践之（三）支持向量机（SVM）进阶
机器学习算法与Python实践之(三)支持向量机(SVM)进阶机器学习算法与Python实践之(三)支持向量机(SVM)进阶 zouxy09@qq.com http://blog.csdn.net/ ...
机器学习算法与Python实践之（二）支持向量机（SVM）初级
机器学习算法与Python实践之(二)支持向量机(SVM)初级机器学习算法与Python实践之(二)支持向量机(SVM)初级 zouxy09@qq.com http://blog.csdn.net/ ...
机器学习算法与Python实践之（五）k均值聚类（k-means）
机器学习算法与Python实践这个系列主要是参考<机器学习实战>这本书.因为自己想学习Python,然后也想对一些机器学习算法加深下了解,所以就想通过Python来实现几个比较常用的机器学 ...
机器学习算法与Python实践之（六）二分k均值聚类
http://blog.csdn.net/zouxy09/article/details/17590137 机器学习算法与Python实践之(六)二分k均值聚类 zouxy09@qq.com http ...
机器学习算法与Python实践之（七）逻辑回归（Logistic Regression）
http://blog.csdn.net/zouxy09/article/details/20319673 机器学习算法与Python实践之(七)逻辑回归(Logistic Regression) z ...
机器学习之路: python k近邻分类器 KNeighborsClassifier 鸢尾花分类预测
使用python语言学习k近邻分类器的api 欢迎来到我的git查看源代码: https://github.com/linyi0604/MachineLearning from sklearn.da ...
机器学习之路: python 回归树 DecisionTreeRegressor 预测波士顿房价
python3 学习api的使用 git: https://github.com/linyi0604/MachineLearning 代码: from sklearn.datasets import ...
机器学习 | 详解GBDT梯度提升树原理，看完再也不怕面试了
本文始发于个人公众号:TechFlow,原创不易,求个关注今天是机器学习专题的第30篇文章,我们今天来聊一个机器学习时代可以说是最厉害的模型--GBDT. 虽然文无第一武无第二,在机器学习领域并没有 ...

随机推荐

NameValuePair方式传参数
今天工作中联调外部的一个接口用post方式传输,我按照文档封装参数成Jason字符串传入,但是对方一直接受参数为空,折腾了半天也没找到问题.很苦恼,检查代码都没有错误,可是为什么对方接受参数为空呢?然 ...
C++ Primer 5th 第18章用于大型程序的工具
C++大规模程序设计至少存在三个特殊要求: 错误处理库的引入复杂建模以上三种对应C++语言的三种特性:异常处理.命名空间.多重继承. 异常处理异常处理机制是一种允许偷懒的工具,在出现非正确的情 ...
Treats for the Cows 区间DP POJ 3186
题目来源:http://poj.org/problem?id=3186 (http://www.fjutacm.com/Problem.jsp?pid=1389) /** 题目意思: 约翰经常给产奶量 ...
2016.5.14——leetcode-HappyNumber,House Robber
leetcode:HappyNumber,House Robber 1.Happy Number 这个题中收获2点: 1.拿到题以后考虑特殊情况,代码中考虑1和4,或者说<6的情况,动手算下.( ...
Dream------scala--Tuple、Array、Map与文件操作
1.Tuple(元组) 一般使用中,假设一个函数返回多个值,我们可以使用tuple接受这个(val (x,y) = myfunction) package com.wls.scala.hello /* ...
【Tomcat】Tomcat配置与优化（内存、并发、管理）【自己配置】
一.JVM内存配置优化主要通过以下的几个jvm参数来设置堆内存的: -Xmx512m 最大总堆内存,一般设置为物理内存的1/4 -Xms512m 初始总堆内存,一般将它设置的和最大堆内存一样大,这样 ...
Add Two Numbers I & II
Add Two Numbers I You have two numbers represented by a linked list, where each node contains a sing ...
TcxScheduler的使用2
DevExpress 行事历(Scheduler)的常用属性.事件和方法参考资料来源:附带的ExpressScheduler 2 Demo, 如想了解更多可以查看Demo. 一.TcxSchedu ...
JDK 6和JDK 7的intern方法之不同
首先介绍下intern方法: 如果常量池中存在当前字符串, 就会直接返回当前字符串. 如果常量池中没有此字符串, 会将此字符串放入常量池中后, 再返回. 1 2 在<深入理解Java虚拟机> ...
Mac ssh
mac的终端默认在打开一个新的tab/window的时候需要重新输入ssh的密码, 很不方便.本文完成在mac中设置,实现secureCRT/xshell里的克隆会话功能, 即新开一个terminal ...

机器学习之路： python 实践 提升树 XGBoost 分类器

机器学习之路： python 实践 提升树 XGBoost 分类器的更多相关文章

随机推荐

热门专题

机器学习之路： python 实践提升树 XGBoost 分类器

机器学习之路： python 实践提升树 XGBoost 分类器的更多相关文章