第十三次作业——回归模型与房价预测&第十一次作业——sklearn中朴素贝叶斯模型及其应用&第七次作业—

第十三次作业——回归模型与房价预测

1. 导入boston房价数据集

2. 一元线性回归模型，建立一个变量与房价之间的预测模型，并图形化显示。

3. 多元线性回归模型，建立13个变量与房价之间的预测模型，并检测模型好坏，并图形化显示检查结果。

4. 一元多项式回归模型，建立一个变量与房价之间的预测模型，并图形化显示。

代码：

#导入boston房价数据集

from sklearn.datasets import load_boston

import  pandas as pd

boston = load_boston()

df = pd.DataFrame(boston.data)　

#一元线性回归模型，建立一个变量与房价之间的预测模型，并图形化显示。

from sklearn.linear_model import LinearRegression

import  matplotlib.pyplot as plt

x =boston.data[:,5]

y = boston.target

LinR = LinearRegression()

LinR.fit(x.reshape(-1,1),y)

w=LinR.coef_

b=LinR.intercept_

print(w,b)

plt.scatter(x,y)

plt.plot(x,w*x+b,'orange')

plt.show()

#多元线性回归模型，建立13个变量与房价之间的预测模型，并检测模型好坏，并图形化显示检查结果。

x = boston.data[:,12].reshape(-1,1)

y = boston.target

plt.figure(figsize=(10,6))

plt.scatter(x,y)

lineR = LinearRegression()

lineR.fit(x,y)

y_pred = lineR.predict(x)

plt.plot(x,y_pred,'r')

print(lineR.coef_,lineR.intercept_)

plt.show()

#一元多项式回归模型，建立一个变量与房价之间的预测模型，并图形化显示。

from sklearn.preprocessing import PolynomialFeatures

poly = PolynomialFeatures(degree=3)

x_poly = poly.fit_transform(x)

print(x_poly)

lrp = LinearRegression()

lrp.fit(x_poly,y)

y_poly_pred = lrp.predict(x_poly)

plt.scatter(x,y)

plt.scatter(x,y_pred)

plt.scatter(x,y_poly_pred)

plt.show()

运行结果：

第十一次作业——sklearn中朴素贝叶斯模型及其应用

1.使用朴素贝叶斯模型对iris数据集进行花分类

尝试使用3种不同类型的朴素贝叶斯：

高斯分布型

多项式型

伯努利型

2.使用sklearn.model_selection.cross_val_score()，对模型进行验证。

3. 垃圾邮件分类

数据准备：

用csv读取邮件数据，分解出邮件类别及邮件内容。
对邮件内容进行预处理：去掉长度小于3的词，去掉没有语义的词等

尝试使用nltk库：

pip install nltk

import nltk

nltk.download

不成功：就使用词频统计的处理方法

训练集和测试集数据划分

from sklearn.model_selection import train_test_split

代码：

# 导入鸢尾花数据集

from sklearn.datasets import load_iris

# 数据选取

iris_data = load_iris()['data']

iris_target = load_iris()['target']

# 用高斯模型进行预测并评估

from sklearn.naive_bayes import GaussianNB

mol = GaussianNB()

result = mol.fit(iris_data,iris_target)

# 对模型进行评估

from sklearn.model_selection import cross_val_score

scores = cross_val_score(mol,iris_data,iris_target,cv=10)

# 对预测结果的正确个数进行计算

print("高斯模型：")

print("数据总数：",len(iris_data),"  错误个数：",(iris_target != predi).sum())

print("Accuracy:%.3f"%scores.mean())

# 用贝努里模型进行预测和评估

from sklearn.naive_bayes import BernoulliNB

bnb = BernoulliNB()

result2 = bnb.fit(iris_data,iris_target)

pred2 = bnb.predict(iris_data)

# 计算错误个数

print("贝努里模型：")

print("数据总数：",len(iris_data),"  错误个数：",(iris_target != pred2).sum())

#模型评分

scores2 = cross_val_score(bnb,iris_data,iris_target)

print("Accuracy:%.3f"%scores2.mean())

# 用多项式建立模型进行预测和评估

from sklearn.naive_bayes import MultinomialNB

mnb = MultinomialNB()

result3 = mnb.fit(iris_data,iris_target)

# 预测

pred3 = result3.predict(iris_data)

# 计算错误个数

print("多项式模型：")

print("数据总数：",iris_data.shape[0],"  错误个数：",(iris_target != pred3).sum())

# 模型评分

scores3 = cross_val_score(mnb,iris_data,iris_target)

print("Accuracy:%.3f"%scores3.mean())

运行结果：

第七次作业——numpy统计分布显示

用np.random.normal()产生一个正态分布的随机数组，并显示出来。

np.random.randn()产生一个正态分布的随机数组，并显示出来。

显示鸢尾花花瓣长度的正态分布图，曲线图，散点图。

代码：

import numpy as np

# 导入鸢尾花数据

from sklearn.datasets import load_iris

data = load_iris()

pental_len = data.data[:,2]

# 计算鸢尾花花瓣长度最大值，平均值，中值，均方差

print("最大值：",np.max(pental_len))

print("平均值：",np.mean(pental_len))

print("中值：",np.median(pental_len))

print("均方差：",np.std(pental_len))

# 用np.random.normal()产生一个正态分布的随机数组，并显示出来

print(np.random.normal(1,4,50))

print('============================================================================')

# np.random.randn()产生一个正态分布的随机数组，并显示出来

print(np.random.randn(50))

# 显示鸢尾花花瓣长度的正态分布图

import matplotlib.pyplot as plt

mu = np.mean(pental_len)

sigma = np.std(pental_len)

num = 10000

rand_data=np.random.normal(mu,sigma,num)

count,bins,ignored=plt.hist(rand_data,30,normed=True)

plt.plot(bins,1/(sigma*np.sqrt(2*np.pi))*np.exp(-(bins-mu)**2/(2*sigma**2)),linewidth=2,color="r")

plt.show()

# 显示鸢尾花花瓣长度曲线图

plt.plot(np.linspace(1,160,num=150),pental_len,'g')

plt.show()

# 显示鸢尾花花瓣长度散点图

plt.scatter(np.linspace(1,160,num=150),pental_len,alpha=1,marker='x')

plt.show()

运行结果：

第十三次作业——回归模型与房价预测&第十一次作业——sklearn中朴素贝叶斯模型及其应用&第七次作业——numpy统计分布显示的更多相关文章

一步步教你轻松学朴素贝叶斯模型算法Sklearn深度篇3
一步步教你轻松学朴素贝叶斯深度篇3(白宁超 2018年9月4日14:18:14) 导读:朴素贝叶斯模型是机器学习常用的模型算法之一,其在文本分类方面简单易行,且取得不错的分类效果.所以很受欢迎,对 ...
机器学习Matlab打击垃圾邮件的分类————朴素贝叶斯模型
该系列来自于我<人工智能>课程回顾总结,以及实验的一部分进行了总结学习机垃圾分类是有监督的学习分类最经典的案例,本文首先回顾了概率论的基本知识.则以及朴素贝叶斯模型的思想.最后给出了垃圾 ...
PGM：贝叶斯网表示之朴素贝叶斯模型naive Bayes
http://blog.csdn.net/pipisorry/article/details/52469064 独立性质的利用条件参数化和条件独立性假设被结合在一起,目的是对高维概率分布产生非常紧凑 ...
11.sklearn中的朴素贝叶斯模型及其应用
#1.使用朴素贝叶斯模型对iris数据集进行花分类 #尝试使用3种不同类型的朴素贝叶斯: #高斯分布型,多项式型,伯努利型 from sklearn import datasets iris=data ...
统计学习1：朴素贝叶斯模型(Numpy实现)
模型生成模型介绍我们定义样本空间为$\mathcal{X} \subseteq \mathbb{R}^n$,输出空间为\(\mathcal{Y} = \{c_1, c_2, ..., c_K\ ...
Python实现利用朴素贝叶斯模型（NBC）进行问句意图分类
目录朴素贝叶斯分类(NBC) 程序简介分类流程字典(dict)构造:用于jieba分词和槽值替换数据集构建代码分析另外:点击右下角魔法阵上的[显示目录],可以导航~~ 朴素贝叶斯分类(NB ...
sklearn中的朴素贝叶斯模型及其应用
1.(1)多项式 from sklearn.datasets import load_iris iris = load_iris() from sklearn.naive_bayes import G ...
R 基于朴素贝叶斯模型实现手机垃圾短信过滤
# 读取数数据, 查看数据结构 df_raw <- read.csv("sms_spam.csv", stringsAsFactors=F) str(df_raw) leng ...
后端程序员之路 18、朴素贝叶斯模型（Naive Bayesian Model，NBM）
贝叶斯推断及其互联网应用(一):定理简介 - 阮一峰的网络日志http://www.ruanyifeng.com/blog/2011/08/bayesian_inference_part_one.ht ...

随机推荐

HDU 3948 The Number of Palindromes（Manacher+后缀数组）
题意求一个字符串中本质不同的回文子串的个数. $ 1\leq |string| \leq 100000$ 思路好像是回文自动机的裸题,但是可以用 $\text{Manacher}$ (马拉车) ...
Docker Swarm Mode 学习笔记（部署服务）
使用 docker service 命令来管理 Swarm 集群中的服务,该命令只能在管理节点上执行. 新建服务 docker service create --replicas 3 -p 80:80 ...
使用教育邮箱激活JetBrains全家桶
如果你还有在校时的邮箱,比如your_name@xxx.edu或者your_name@xxx.edu.cn的邮箱,那么你可以免费激活JetBrains全家桶. JetBrains Toolbox 专业 ...
Lintcode225-Find Node in Linked List-Naive
225. Find Node in Linked List Find a node with given value in a linked list. Return null if not exis ...
Sonar 配置及部署（Linux系统）
之前在windows系统上部署了sonar代码审查,由于工作需要,需要在Linux环境再部署一套. 其实,部署的大体都是大同小异的,这里罗列下各个配置,与windows部署不同的地方会重点说一下. 数 ...
如何解决WebBrowser.DocumentCompleted事件的多次调用
转载:https://www.cnblogs.com/rchlz/archive/2009/02/27/1399274.html 关于DocumentCompleted事件,MSDN给出的解释是在文档 ...
Python方法和属性的动态绑定 --面向对象
需要了解的: __ slots __:属于魔术变量,即:系统实现某些特定功能的变量 __ slots __: 1.限定类实例能添加的属性 2.对当前类起作用,对继承的子类是不起作用的实操: # co ...
记一次oracle数据库复制过程
记录一次自己数据库复制的过程(从公司测试环境复制到客户测试环境),主要是每次自己都会忘记,不如记录一下,方便自己以后找,因此,本篇内容不会很详细,主要是用于给我自己提醒,相对于一种记笔记的效果. cm ...
MATLAB常用函数（不定时更新）
1.pause 一般情况下pause(a)表示程序暂停a秒后继续执行,但有时候也存在这种情况,程序中只有pause:并没有参数a,这样的意思是程序暂停,按任意键程序继续执行.2.uiwait(h,ti ...
spark mllib prefixspan demo
./bin/spark-submit ~/src_test/prefix_span_test.py source code: import os import sys from pyspark.mll ...

第十三次作业——回归模型与房价预测&第十一次作业——sklearn中朴素贝叶斯模型及其应用&第七次作业——numpy统计分布显示

第十三次作业——回归模型与房价预测&第十一次作业——sklearn中朴素贝叶斯模型及其应用&第七次作业——numpy统计分布显示的更多相关文章

随机推荐

热门专题