sklearn中的朴素贝叶斯模型及其应用

1、（1）多项式

from sklearn.datasets import load_iris

iris = load_iris()

from sklearn.naive_bayes import GaussianNB#贝叶斯

gnb = GaussianNB()

pred = gnb.fit(iris.data,iris.target)

y_pred = pred.predict(iris.data)#预测

print(iris.data.shape[0],(iris.target!=y_pred).sum())

from sklearn.naive_bayes import BernoulliNB

bnl = BernoulliNB()

pred = bnl.fit(iris.data,iris.target)#g构造模型

y_pred = pred.predict(iris.data)#预测

print(iris.data.shape[0],(iris.target!=y_pred).sum())

（2）高斯分布型

from sklearn.naive_bayes import GaussianNB

gnb1=GaussianNB()#构造建立模型

pred=gnb1.fit(iris.data,iris.target)#模型训练，拟合

y_pred=gnb1.predict(iris.data)#分类预测

print(iris.data.shape[0],(iris.target!=y_pred).sum())

scores=cross_val_score(gnb1,iris.data,iris.target,cv=10)

print("Accuracy:%.3f"%scores.mean())

print(y_pred)

（3）伯努利型

from sklearn.naive_bayes import BernoulliNB

gnb2=BernoulliNB()#构造

pred=gnb2.fit(iris.data,iris.target)#模型训练，拟合

y_pred=gnb2.predict(iris.data)#分类预测

print(iris.data.shape[0],(iris.target!=y_pred).sum())

scores=cross_val_score(gnb2,iris.data,iris.target,cv=10)

print("Accuracy:%.3f"%scores.mean())

print(y_pred)

2、

from sklearn.datasets import load_iris

iris = load_iris()

from sklearn.naive_bayes import GaussianNB

from sklearn.model_selection import cross_val_score

gnb=GaussianNB()

scores=cross_val_score(gnb,iris.data,iris.target,cv=10)

print("Accuracy:%.3f"%scores.mean())

from sklearn.naive_bayes import BernoulliNB

from sklearn.model_selection import cross_val_score

gnb=BernoulliNB()

scores=cross_val_score(gnb,iris.data,iris.target,cv=10)

print("Accuracy:%.3f"%scores.mean())

from sklearn.naive_bayes import MultinomialNB

from sklearn.model_selection import cross_val_score

gnb=MultinomialNB()

scores=cross_val_score(gnb,iris.data,iris.target,cv=10)

print("Accuracy:%.3f"%scores.mean())

3、

import csv

file_path=r'D:\1\SMSSpamCollectionjsn.txt'

sms=open(file_path,'r',encoding='utf-8')

sms_data=[]#邮件的内容

sms_label=[]#邮件的类别

csv_reader=csv.reader(sms,delimiter='\t')

for line in csv_reader:

    sms_label.append(line[0])

    sms_data.append(line[1])

sms.close()

sms_data=str(sms_data)#将列表转化为字符串

sms_data=sms_data.lower()#对大小写进行处理

sms_data=sms_data.split()#变成列表的形式

sms_data1=[]#存放处理后的内容

i=0

for i in sms_data:#去掉长度小于3的单词

    if len(i)>4:

        sms_data1.append(i)

        continue

sklearn中的朴素贝叶斯模型及其应用的更多相关文章

11.sklearn中的朴素贝叶斯模型及其应用
#1.使用朴素贝叶斯模型对iris数据集进行花分类 #尝试使用3种不同类型的朴素贝叶斯: #高斯分布型,多项式型,伯努利型 from sklearn import datasets iris=data ...
统计学习1：朴素贝叶斯模型(Numpy实现)
模型生成模型介绍我们定义样本空间为$\mathcal{X} \subseteq \mathbb{R}^n$,输出空间为\(\mathcal{Y} = \{c_1, c_2, ..., c_K\ ...
第十三次作业——回归模型与房价预测&第十一次作业——sklearn中朴素贝叶斯模型及其应用&第七次作业——numpy统计分布显示
第十三次作业——回归模型与房价预测 1. 导入boston房价数据集 2. 一元线性回归模型,建立一个变量与房价之间的预测模型,并图形化显示. 3. 多元线性回归模型,建立13个变量与房价之间的预测模 ...
一步步教你轻松学朴素贝叶斯模型算法Sklearn深度篇3
一步步教你轻松学朴素贝叶斯深度篇3(白宁超 2018年9月4日14:18:14) 导读:朴素贝叶斯模型是机器学习常用的模型算法之一,其在文本分类方面简单易行,且取得不错的分类效果.所以很受欢迎,对 ...
机器学习Matlab打击垃圾邮件的分类————朴素贝叶斯模型
该系列来自于我<人工智能>课程回顾总结,以及实验的一部分进行了总结学习机垃圾分类是有监督的学习分类最经典的案例,本文首先回顾了概率论的基本知识.则以及朴素贝叶斯模型的思想.最后给出了垃圾 ...
PGM：贝叶斯网表示之朴素贝叶斯模型naive Bayes
http://blog.csdn.net/pipisorry/article/details/52469064 独立性质的利用条件参数化和条件独立性假设被结合在一起,目的是对高维概率分布产生非常紧凑 ...
Python实现利用朴素贝叶斯模型（NBC）进行问句意图分类
目录朴素贝叶斯分类(NBC) 程序简介分类流程字典(dict)构造:用于jieba分词和槽值替换数据集构建代码分析另外:点击右下角魔法阵上的[显示目录],可以导航~~ 朴素贝叶斯分类(NB ...
后端程序员之路 18、朴素贝叶斯模型（Naive Bayesian Model，NBM）
贝叶斯推断及其互联网应用(一):定理简介 - 阮一峰的网络日志http://www.ruanyifeng.com/blog/2011/08/bayesian_inference_part_one.ht ...
R 基于朴素贝叶斯模型实现手机垃圾短信过滤
# 读取数数据, 查看数据结构 df_raw <- read.csv("sms_spam.csv", stringsAsFactors=F) str(df_raw) leng ...

随机推荐

Quick Sort -- 快速排序算法
//参数说明: // int data[] : 待排序的数据数组 // int m : 下限值 // int n : 上限值 void QuickSort ( int data[] , int m , ...
swiper 不同页面高度自适应
在使用swiper写页面滑动时发现不同页面高度无法自适应,使用autoHeight:true也不起作用研究了一下发现可以这样设置 .swiper-slide{ overflow: hidden; } ...
Spring _day01_下载、概述、监听器
Spring:SE/EE开发的一站式框架. .一站式框架:有EE开发的每一层解决方案. . WEB层 :SpringMVC . Service层 :Spring的Bean管理,Spring ...
css 底层知识点
(摘自张鑫旭老师的课程内容) position: absolute 1. 定位元素(关闭按钮etc):dom顺序保持正确,然后根据absolute的位置跟随性(脱离文档流但是位置不变)和margin值 ...
机器学习 xgboost 笔记
一.数据预处理.特征工程类别变量 labelencoder就够了,使用onehotencoder反而会降低性能.其他处理方式还有均值编码(对于存在大量分类的特征,通过监督学习,生成数值变量).转换处 ...
浅析HashMap的实现原理
本文参照https://www.cnblogs.com/chengxiao/p/6059914.html#commentform作者的文章,并分享一些自己的体会. 本文将主要回答以下两个问题: 1. ...
1.3 SQL循环
1.while循环(1~20的和) 2.while_break_continue(1~20偶数和) 3.if选择象限 4.return:在查询中无条件退出,return后面的语句将不会被执行. 5.g ...
Java继承2
1.为什么使用继承从已有的类派生出新的类,称为继承. 在不同的类中也可能会有共同的特征和动作,可以把这些共同的特征和动作放在一个类中,让其它类共享. 因此可以定义一个通用类,然后将其扩展为其它多个特 ...
java基础知识—继承
1.不能被继承的父类成员: private成员.子类与父类不在同包,使用默认访问权限的成员.构造方法. 2.访问修饰符: 访问修饰符本类同包子类其它 ...
Linux基础命令--date
date命令格式用法 yao@yao:~/shells/tmp$ date +%Y%m%d20190405 yao@yao:~/shells/tmp$ date +%Y%m%d%H%M%S201904 ...

sklearn中的朴素贝叶斯模型及其应用

sklearn中的朴素贝叶斯模型及其应用的更多相关文章

随机推荐

热门专题