机器学习之路： python 实践提升树 XGBoost 分类器

git: https://github.com/linyi0604/MachineLearning

数据集被我下载到本地，可以去我的git上拿数据集

XGBoost
提升分类器
属于集成学习模型
把成百上千个分类准确率较低的树模型组合起来
不断迭代,每次迭代生成一颗新的树

下面对泰坦尼克遇难预测
使用XGBoost模型和其他分类器性能进行比较

 import pandas as pd

 from sklearn.cross_validation import train_test_split

 from sklearn.feature_extraction import DictVectorizer

 from sklearn.ensemble import RandomForestClassifier

 from xgboost import XGBClassifier

 '''

 XGBoost

 提升分类器

     属于集成学习模型

     把成百上千个分类准确率较低的树模型组合起来

     不断迭代,每次迭代生成一颗新的树

 下面 对泰坦尼克遇难预测

 使用XGBoost模型 和 其他分类器性能进行比较

 '''

 titanic = pd.read_csv("../data/titanic/titanic.txt")

 # 抽取pclass age 和 sex 作为训练样本

 x = titanic[["pclass", "age", "sex"]]

 y = titanic["survived"]

 # 采集的age空的用平均数补全

 x["age"].fillna(x["age"].mean(), inplace=True)

 # 分割训练数据和测试数据

 x_train, x_test, y_train, y_test = train_test_split(x,

                                                     y,

                                                     test_size=0.25,

                                                     random_state=33)

 # 提取字典特征 进行 向量化

 vec = DictVectorizer()

 x_train = vec.fit_transform(x_train.to_dict(orient="record"))

 x_test = vec.transform(x_test.to_dict(orient="record"))

 # 采用默认配置的随机森林进行预测

 rfc = RandomForestClassifier()

 rfc.fit(x_train, y_train)

 print("随机森林预测准确率:", rfc.score(x_test, y_test))  # 0.7811550151975684

 # 采用XGBoost模型进行预测

 xgbc = XGBClassifier()

 xgbc.fit(x_train, y_train)

 print("XGBoost预测准确率:", xgbc.score(x_test, y_test))  # 0.7872340425531915

机器学习之路： python 实践提升树 XGBoost 分类器的更多相关文章

机器学习算法与Python实践之（四）支持向量机（SVM）实现
机器学习算法与Python实践之(四)支持向量机(SVM)实现机器学习算法与Python实践之(四)支持向量机(SVM)实现 zouxy09@qq.com http://blog.csdn.net/ ...
机器学习算法与Python实践之（三）支持向量机（SVM）进阶
机器学习算法与Python实践之(三)支持向量机(SVM)进阶机器学习算法与Python实践之(三)支持向量机(SVM)进阶 zouxy09@qq.com http://blog.csdn.net/ ...
机器学习算法与Python实践之（二）支持向量机（SVM）初级
机器学习算法与Python实践之(二)支持向量机(SVM)初级机器学习算法与Python实践之(二)支持向量机(SVM)初级 zouxy09@qq.com http://blog.csdn.net/ ...
机器学习算法与Python实践之（五）k均值聚类（k-means）
机器学习算法与Python实践这个系列主要是参考<机器学习实战>这本书.因为自己想学习Python,然后也想对一些机器学习算法加深下了解,所以就想通过Python来实现几个比较常用的机器学 ...
机器学习算法与Python实践之（六）二分k均值聚类
http://blog.csdn.net/zouxy09/article/details/17590137 机器学习算法与Python实践之(六)二分k均值聚类 zouxy09@qq.com http ...
机器学习算法与Python实践之（七）逻辑回归（Logistic Regression）
http://blog.csdn.net/zouxy09/article/details/20319673 机器学习算法与Python实践之(七)逻辑回归(Logistic Regression) z ...
机器学习之路: python k近邻分类器 KNeighborsClassifier 鸢尾花分类预测
使用python语言学习k近邻分类器的api 欢迎来到我的git查看源代码: https://github.com/linyi0604/MachineLearning from sklearn.da ...
机器学习之路: python 回归树 DecisionTreeRegressor 预测波士顿房价
python3 学习api的使用 git: https://github.com/linyi0604/MachineLearning 代码: from sklearn.datasets import ...
机器学习 | 详解GBDT梯度提升树原理，看完再也不怕面试了
本文始发于个人公众号:TechFlow,原创不易,求个关注今天是机器学习专题的第30篇文章,我们今天来聊一个机器学习时代可以说是最厉害的模型--GBDT. 虽然文无第一武无第二,在机器学习领域并没有 ...

随机推荐

【leetcode 简单】第五十六题快乐数
编写一个算法来判断一个数是不是“快乐数”. 一个“快乐数”定义为:对于一个正整数,每一次将该数替换为它每个位置上的数字的平方和,然后重复这个过程直到这个数变为 1,也可能是无限循环但始终变不到 1.如 ...
倍增 Tarjan 求LCA
...
linux中set、unset、export、env、declare,readonly的区别以及用法
set命令显示当前shell的变量,包括当前用户的变量; env命令显示当前用户的变量; export命令显示当前导出成用户变量的shell变量. 每个shell有自己特有 ...
使用httpClient调用接口,参数用map封装或者使用JSON参数,并转换返回结果
这里接口用表存起来,标记请求方式,然后接受参数,消息或者请求参数都可以, 然后先是遍历需要调用的接口,封装参数,再分别调用get与post即可,没有微服务还是得自己写 //消息转发-获取参数中对应参数 ...
【codeforces】【比赛题解】#950 CF Round #469 (Div. 2)
剧毒比赛,至少涨了分对吧.: ( [A]Left-handers, Right-handers and Ambidexters 题意: 有$l$个右撇子,$r$个左撇子,$a$个双手都惯用 ...
PHP 中 int 和 integer 类型的区别
半夜整理东西,发现一个以前没留意到的小问题. function show($id) : int { return $id; } function show($id) : integer { retur ...
在c++中实现反射的初步想法
最近在思考如何在c++中实现反射.事情的起因是这样的:我们服务器是用c++开发的,如果需要写一些测试用的GM指令的话,需要编写完GM代码后重新编译并且重启进程,工序繁琐且比较耗时.因此就有了想用脚本( ...
php CI框架
CodeIgniter 是一个小巧但功能强大的 PHP 框架,作为一个简单而“优雅”的工具包,它可以为 PHP 程序员建立功能完善的 Web 应用程序.如果你是一个使用共享主机,并且为客户所要求的期限 ...
缓存数据库-redis(订阅发布)
一:Redis 发布订阅 Redis 发布订阅(pub/sub)是一种消息通信模式:发送者(pub)发送消息,订阅者(sub)接收消息. Redis 客户端可以订阅任意数量的频道. 下图展示了频道 c ...
hdu 5131 (2014广州现场赛 E题)
题意:对给出的好汉按杀敌数从大到小排序,若相等,按字典序排.M个询问,询问名字输出对应的主排名和次排名.(排序之后)主排名是在该名字前比他杀敌数多的人的个数加1,次排名是该名字前和他杀敌数相等的人的个 ...

机器学习之路： python 实践 提升树 XGBoost 分类器

机器学习之路： python 实践 提升树 XGBoost 分类器的更多相关文章

随机推荐

热门专题

机器学习之路： python 实践提升树 XGBoost 分类器

机器学习之路： python 实践提升树 XGBoost 分类器的更多相关文章