sklearn常见分类器(二分类模板)

# -*- coding: utf-8 -*-

import pandas as pd

import matplotlib

matplotlib.rcParams['font.sans-serif']=[u'simHei']

matplotlib.rcParams['axes.unicode_minus']=False

from sklearn.tree import DecisionTreeClassifier

from sklearn.model_selection import train_test_split

from sklearn.metrics import classification_report

from sklearn.pipeline import Pipeline

from sklearn.model_selection import GridSearchCV

from sklearn.ensemble import RandomForestClassifier

from sklearn.metrics import accuracy_score

from sklearn.datasets import load_breast_cancer

data_set = pd.read_csv('pima-indians-diabetes.csv')

data = data_set.values[:,:]

y = data[:,8]

X = data[:,:8]

X_train,X_test,y_train,y_test = train_test_split(X,y)

### 随机森林

print("==========================================")

RF = RandomForestClassifier(n_estimators=10,random_state=11)

RF.fit(X_train,y_train)

predictions = RF.predict(X_test)

print("RF")

print(classification_report(y_test,predictions))

print("AC",accuracy_score(y_test,predictions))

### Logistic Regression Classifier

print("==========================================")

from sklearn.linear_model import LogisticRegression

clf = LogisticRegression(penalty='l2')

clf.fit(X_train,y_train)

predictions = clf.predict(X_test)

print("LR")

print(classification_report(y_test,predictions))

print("AC",accuracy_score(y_test,predictions))

### Decision Tree Classifier

print("==========================================")

from sklearn import tree

clf = tree.DecisionTreeClassifier()

clf.fit(X_train,y_train)

predictions = clf.predict(X_test)

print("DT")

print(classification_report(y_test,predictions))

print("AC",accuracy_score(y_test,predictions))

### GBDT(Gradient Boosting Decision Tree) Classifier

print("==========================================")

from sklearn.ensemble import GradientBoostingClassifier

clf = GradientBoostingClassifier(n_estimators=200)

clf.fit(X_train,y_train)

predictions = clf.predict(X_test)

print("GBDT")

print(classification_report(y_test,predictions))

print("AC",accuracy_score(y_test,predictions))

###AdaBoost Classifier

print("==========================================")

from sklearn.ensemble import  AdaBoostClassifier

clf = AdaBoostClassifier()

clf.fit(X_train,y_train)

predictions = clf.predict(X_test)

print("AdaBoost")

print(classification_report(y_test,predictions))

print("AC",accuracy_score(y_test,predictions))

### GaussianNB

print("==========================================")

from sklearn.naive_bayes import GaussianNB

clf = GaussianNB()

clf.fit(X_train,y_train)

predictions = clf.predict(X_test)

print("GaussianNB")

print(classification_report(y_test,predictions))

print("AC",accuracy_score(y_test,predictions))

### Linear Discriminant Analysis

print("==========================================")

from sklearn.discriminant_analysis import LinearDiscriminantAnalysis

clf = LinearDiscriminantAnalysis()

clf.fit(X_train,y_train)

predictions = clf.predict(X_test)

print("Linear Discriminant Analysis")

print(classification_report(y_test,predictions))

print("AC",accuracy_score(y_test,predictions))

### Quadratic Discriminant Analysis

print("==========================================")

from sklearn.discriminant_analysis import QuadraticDiscriminantAnalysis

clf = QuadraticDiscriminantAnalysis()

clf.fit(X_train,y_train)

predictions = clf.predict(X_test)

print("Quadratic Discriminant Analysis")

print(classification_report(y_test,predictions))

print("AC",accuracy_score(y_test,predictions))

### SVM Classifier

print("==========================================")

from sklearn.svm import SVC

clf = SVC(kernel='rbf', probability=True)

clf.fit(X_train,y_train)

predictions = clf.predict(X_test)

print("SVM")

print(classification_report(y_test,predictions))

print("AC",accuracy_score(y_test,predictions))

### Multinomial Naive Bayes Classifier

print("==========================================")

from sklearn.naive_bayes import MultinomialNB

clf = MultinomialNB(alpha=0.01)

clf.fit(X_train,y_train)

predictions = clf.predict(X_test)

print("Multinomial Naive Bayes")

print(classification_report(y_test,predictions))

print("AC",accuracy_score(y_test,predictions))

### xgboost

import xgboost

print("==========================================")

from sklearn.naive_bayes import MultinomialNB

clf = xgboost.XGBClassifier()

clf.fit(X_train,y_train)

predictions = clf.predict(X_test)

print("xgboost")

print(classification_report(y_test,predictions))

print("AC",accuracy_score(y_test,predictions))

### voting_classify

from sklearn.ensemble import GradientBoostingClassifier, VotingClassifier, RandomForestClassifier

import xgboost

from sklearn.linear_model import LogisticRegression

from sklearn.naive_bayes import GaussianNB

clf1 = GradientBoostingClassifier(n_estimators=200)

clf2 = RandomForestClassifier(random_state=0, n_estimators=500)

# clf3 = LogisticRegression(random_state=1)

# clf4 = GaussianNB()

clf5 = xgboost.XGBClassifier()

clf = VotingClassifier(estimators=[

    # ('gbdt',clf1),

    ('rf',clf2),

    # ('lr',clf3),

    # ('nb',clf4),

    # ('xgboost',clf5),

    ],

    voting='soft')

clf.fit(X_train,y_train)

predictions = clf.predict(X_test)

print("voting_classify")

print(classification_report(y_test,predictions))

print("AC",accuracy_score(y_test,predictions))

sklearn常见分类器(二分类模板)的更多相关文章

sklearn常见分类器的效果比较
sklearn 是 python 下的机器学习库. scikit-learn的目的是作为一个“黑盒”来工作,即使用户不了解实现也能产生很好的结果. 其功能非常强大,当然也有很多不足的地方,就比如说神经 ...
基于sklearn的分类器实战
已迁移到我新博客,阅读体验更佳基于sklearn的分类器实战完整代码实现见github:click me 一.实验说明 1.1 任务描述 1.2 数据说明一共有十个数据集,数据集中的数据属性有全部 ...
sklearn 组合分类器
组合分类器: 组合分类器有4种方法: (1)通过处理训练数据集.如baging boosting (2)通过处理输入特征.如 Random forest (3)通过处理类标号.error_corre ...
sklearn各种分类器简单使用
sklearn中有很多经典分类器,使用非常简单:1.导入数据 2.导入模型 3.fit--->predict 下面的示例为在iris数据集上用各种分类器进行分类: #用各种方式在iris数据集上 ...
python_mmdt:从0到1--实现简单恶意代码分类器(二)
概述上篇文章python_mmdt:一种基于敏感哈希生成特征向量的python库(一)我们介绍了一种叫mmdt_hash(敏感哈希)生成方法,并对其中的概念做了基本介绍.本篇,我们重点谈谈mmdt_ ...
常见模块(二) logging模块
logging模块是专门做日志系统的.分为函数版和自定义函数. (一)logging模块初级版缺点,不能指定字符集,不能把屏幕输出和文件日志同时记录.只能选择其一. 文件记录日志 import lo ...
(6)UIView常见属性二
例如创建一个view视图,view是最纯洁的控制,必须得指定它的位置,而不像其他的控件像UISwitch默认都有一个位置在viewDidLoad方法中打印它的位置: 将控件放入一个视图中,只需移动白 ...
Oracle面试过程中常见的二十个问题
1.冷备份和热备份的不同点以及各自的优点解答:热备份针对归档模式的数据库,在数据库仍旧处于工作状态时进行备份.而冷备份指在数据库关闭后,进行备份,适用于所有模式的数据库.热备份的优点在于当备份时, ...
讲解Oracle面试过程中常见的二十个问题
1.冷备份和热备份的不同点以及各自的优点解答:热备份针对归档模式的数据库,在数据库仍旧处于工作状态时进行备份.而冷备份指在数据库关闭后,进行备份,适用于所有模式的数据库.热备份的优点在于当备 ...

随机推荐

API接口文档中将Swagger文档转Word 文档
一般的开发工作,尤其是API接口的开发工作,首先要有开发文档,接口说明文档 ok,后来开发完毕了和页面联调,或者是和第三方联调的时候, 这个时候,SA systeam admin 就会开始直接让开发 ...
Python 文件操作（2）
上一篇学习了用内置函数 open() 来打开文件,并且用 f.close() 来关闭文件. 今天来学习对这个文件对象的其他操作:读.写.找到文件当前位置-- 1.读取文件三种方法: read([si ...
使用phpstudy搭建的外网网站运行很慢解决办法
将连接数据库的配置文件 localhost 修改为127.0.0.1 PHP5.3以上,如果是链接localhost,会检测是IPV4还是IPV6,所以会比较慢.解决办法是:链接数据的时候,不要填写 ...
[转载]Java 内存分配全面浅析
Java 内存分配全面浅析 2013-02-20 17:54:45 袭烽阅读数 91353更多分类专栏: java基础本文将由浅入深详细介绍Java内存分配的原理,以帮助新手更轻松的学习Ja ...
Junit加载Spring容器作单元测试
阅读目录 > 基本的搭建 > 常见的用法如果我们需要对我们的Service方法作单元测试,恰好又是用Spring作为IOC容器的,我们可以这么配置Junit加载Spring容器,方便做单 ...
MySQL添加foreign key时出现1215 Cannot add the foreign key constraint
引言: MySQL中经常会需要创建父子表之间的约束,这个约束是需要建立在主外键基础之上的,这里解决了一个在创建主外键约束过程中碰到的一个问题. mysql中添加外键约束遇到一下情况: cannot a ...
Java File类方法使用详解
Java File类的功能非常强大,利用java基本上可以对文件进行所有操作.文本将对Java File 文件操作的类详细的分析,并将File类中的常用方法进行简单介绍. 构造函数 public cl ...
python 函数中，os.linesep是干什么的
os.linesep字符串给出当前平台使用的行终止符.例如,Windows使用'\r\n',Linux使用'\n'而Mac使用'\r'. def write_file(filename, subdom ...
BZOJ 1299: [LLH邀请赛]巧克力棒【SG函数/博弈分析/高斯消元】
因为太懒,放个博客我只写了O(2n)O(2^n)O(2n)的 CODE #include <cstdio> int n, x[15]; int main () { for(int T = ...
Codeforces Round #495 (Div. 2) A,B,C
A题 1.新添加一间酒店,要求酒店离已有的最近的一间酒店的距离恰好等于d 2.最左和最右必定存在合适的两种情况 3.酒店之间的情况就要判断两间酒店间的距离: 小于2d,表示无法在这两间酒店中间找到合适 ...

sklearn常见分类器(二分类模板)

sklearn常见分类器(二分类模板)的更多相关文章

随机推荐

热门专题