更新、更全的《机器学习》的更新网站，更有python、go、数据结构与算法、爬虫、人工智能教学等着你：https://www.cnblogs.com/nickchen121/p/11686958.html

Logistic回归(鸢尾花分类)

一、导入模块

import numpy as np

import matplotlib.pyplot as plt

from matplotlib.colors import ListedColormap

from matplotlib.font_manager import FontProperties

from sklearn import datasets

from sklearn.linear_model import LogisticRegression

%matplotlib inline

font = FontProperties(fname='/Library/Fonts/Heiti.ttc')

二、获取数据

iris_data = datasets.load_iris()

X = iris_data.data[:, [2, 3]]

y = iris_data.target

label_list = ['山鸢尾', '杂色鸢尾', '维吉尼亚鸢尾']

三、构建决策边界

def plot_decision_regions(X, y, classifier=None):

    marker_list = ['o', 'x', 's']

    color_list = ['r', 'b', 'g']

    cmap = ListedColormap(color_list[:len(np.unique(y))])

    x1_min, x1_max = X[:, 0].min()-1, X[:, 0].max()+1

    x2_min, x2_max = X[:, 1].min()-1, X[:, 1].max()+1

    t1 = np.linspace(x1_min, x1_max, 666)

    t2 = np.linspace(x2_min, x2_max, 666)

    x1, x2 = np.meshgrid(t1, t2)

    y_hat = classifier.predict(np.array([x1.ravel(), x2.ravel()]).T)

    y_hat = y_hat.reshape(x1.shape)

    plt.contourf(x1, x2, y_hat, alpha=0.2, cmap=cmap)

    plt.xlim(x1_min, x1_max)

    plt.ylim(x2_min, x2_max)

    for ind, clas in enumerate(np.unique(y)):

        plt.scatter(X[y == clas, 0], X[y == clas, 1], alpha=0.8, s=50,

                    c=color_list[ind], marker=marker_list[ind], label=label_list[clas])

四、训练模型

# C与正则化参数λ成反比，即减小参数C增大正则化的强度

# lbfgs使用拟牛顿法优化参数

# 分类方式为OvR（One-vs-Rest）

lr = LogisticRegression(C=100, random_state=1,

                        solver='lbfgs', multi_class='ovr')

lr.fit(X, y)

LogisticRegression(C=100, class_weight=None, dual=False, fit_intercept=True,

          intercept_scaling=1, max_iter=100, multi_class='ovr',

          n_jobs=None, penalty='l2', random_state=1, solver='lbfgs',

          tol=0.0001, verbose=0, warm_start=False)

4.1 C参数与权重系数的关系

weights, params = [], []

for c in np.arange(-5, 5):

    lr = LogisticRegression(C=10.**c, random_state=1,

                            solver='lbfgs', multi_class='ovr')

    lr.fit(X, y)

    # lr.coef_[1]拿到类别1的权重系数

    weights.append(lr.coef_[1])

    params.append(10.**c)

# 把weights转为numpy数组，即包含两个特征的权重的数组

weights = np.array(weights)

'''

params:

[1e-05, 0.0001, 0.001, 0.01, 0.1, 1.0, 10.0, 100.0, 1000.0, 10000.0]

'''

'''

weights:

[[ 2.50572107e-04  6.31528229e-05]

 [ 2.46565843e-03  6.15303747e-04]

 [ 2.13003731e-02  4.74899392e-03]

 [ 9.09176960e-02 -1.80703318e-03]

 [ 1.19168871e-01 -2.19313511e-01]

 [ 8.35644722e-02 -9.08030470e-01]

 [ 1.60682631e-01 -2.15860167e+00]

 [ 5.13026897e-01 -2.99137299e+00]

 [ 1.14643413e+00 -2.79518356e+00]

 [ 1.90317264e+00 -2.26818639e+00]]

'''

plt.plot(params, weights[:, 0], linestyle='--', c='r', label='花瓣长度（cm）')

plt.plot(params, weights[:, 1], c='g', label='花瓣长度（cm）')

plt.xlabel('C')

# 改变x轴的刻度

plt.xscale('log')

plt.ylabel('权重系数', fontproperties=font)

plt.legend(prop=font)

plt.show()

上图显示了10个不同的逆正则化参数C值拟合逻辑回归模型，此处只收集标签为1（杂色鸢尾）的权重系数。由于数据没有经过处理，所以显示的不太美观，但是总体趋势还是可以看出减小参数C会增大正则化强度，在\(10^{-3}\)的时候权重系数开始收敛为0。

五、可视化

plot_decision_regions(X, y, classifier=lr)

plt.xlabel('花瓣长度（cm）', fontproperties=font)

plt.ylabel('花瓣宽度（cm）', fontproperties=font)

plt.legend(prop=font)

plt.show()

02-15 Logistic回归(鸢尾花分类)的更多相关文章

【2008nmj】Logistic回归二元分类感知器算法.docx
给你一堆样本数据(xi,yi),并标上标签[0,1],让你建立模型(分类感知器二元),对于新给的测试数据进行分类. 要将两种数据分开,这是一个分类问题,建立数学模型,(x,y,z),z指示[0,1], ...
神经网络、logistic回归等分类算法简单实现
最近在github上看到一个很有趣的项目,通过文本训练可以让计算机写出特定风格的文章,有人就专门写了一个小项目生成汪峰风格的歌词.看完后有一些自己的小想法,也想做一个玩儿一玩儿.用到的原理是深度学习里 ...
Logistic回归二分类Winner or Losser----台大李宏毅机器学习作业二(HW2)
一.作业说明给定训练集spam_train.csv,要求根据每个ID各种属性值来判断该ID对应角色是Winner还是Losser(0.1分类). 训练集介绍: (1)CSV文件,大小为4000行X5 ...
《转》Logistic回归多分类问题的推广算法--Softmax回归
转自http://ufldl.stanford.edu/wiki/index.php/Softmax%E5%9B%9E%E5%BD%92 简介在本节中,我们介绍Softmax回归模型,该模型是log ...
如何在R语言中使用Logistic回归模型
在日常学习或工作中经常会使用线性回归模型对某一事物进行预测,例如预测房价.身高.GDP.学生成绩等,发现这些被预测的变量都属于连续型变量.然而有些情况下,被预测变量可能是二元变量,即成功或失败.流失或 ...
机器学习之三：logistic回归(最优化)
一般来说,回归不用在分类问题上,因为回归是连续型模型,而且受噪声影响比较大.如果非要应用进入,可以使用logistic回归. logistic回归本质上是线性回归,只是在特征到结果的映射中加入了一层函 ...
七，专著研读（Logistic回归）
七,专著研读(Logistic回归) 分类:k-近邻算法,决策树,朴素贝叶斯,Logistic回归,支持向量机,AdaBoost算法. 运用 k-近邻算法,使用距离计算来实现分类决策树,构建直观的树 ...
Logistic回归应用-预测马的死亡率
Logistic回归应用-预测马的死亡率本文所有代码均来自<机器学习实战>,数据也是本例中的数据有以下几个特征: 部分指标比较主观.难以很好的定量测量,例如马的疼痛级别数据集中有30 ...
《Machine Learning in Action》—— Taoye给你讲讲Logistic回归是咋回事
在手撕机器学习系列文章的上一篇,我们详细讲解了线性回归的问题,并且最后通过梯度下降算法拟合了一条直线,从而使得这条直线尽可能的切合数据样本集,已到达模型损失值最小的目的. 在本篇文章中,我们主要是手撕 ...

随机推荐

Python学习之旅：使用virtualenv创建Python环境及PyQT5环境配置
一.写在前面从学 Python 的第一天起,我就知道了使用 pip 命令来安装包,从学习爬虫到学习 Web 开发,安装的库越来越多,从 requests 到 lxml,从 Django 到 Flas ...
【JavaWeb】Servlet3.0中注解驱动开发
一.概述二.@WebServlet注解三.共享库/运行时插件 2.1 注册Servlet 2.2 注册监听器 2.3 注册过滤器一.概述 Servlet3.0中引入了注解开发二.@WebSer ...
体验一下：AndroidX
背景今天在更新 ButterKnife 到最新版本的时候出现了一个问题,我引入的是 10.1.0 最新版本: implementation 'com.jakewharton:butterknife: ...
C#中使用StreamReader实现文本文件的读取与写入
场景实现一个 TextReader,使其以一种特定的编码从字节流中读取字符. 关注公众号霸道的程序猿获取编程相关电子书.教程推送与免费下载. 大量编程视频教程:https://space.bilib ...
Python文件访问编码格式问题UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position xx: 解决方案
1.Python读取文件 # .打开文件 file = open("ReadMe") # .读取文件类容 text = file.read() print(text) # .关闭文 ...
〈二〉ElasticSearch的认识：索引、类型、文档
目录上节回顾本节前言索引index 创建索引查看索引查看单个索引查看所有索引删除索引修改索引修改副本分片数量关闭索引索引别名增加索引别名: 查看索引别名: 删除索引别名: 补充 ...
如何更规范化使用MySQL
如何更规范化使用MySQL 背景:一个平台或系统随着时间的推移和用户量的增多,数据库操作往往会变慢:而在Java应用开发中数据库更是尤为重要,绝大多数情况下数据库的性能决定了程序的性能,如若前期埋下的 ...
C++消息框架-基于sigslot
目录一.简介二.消息三.发送者 1.发送消息函数 2.新增一个接收者函数 3.移除一个接收者函数四.接收者五.功能测试 1.消息接收类 2.测试代码 3.测试结果六.源码一.简介上一篇 ...
使用broker进行Datagurd主备切换报ORA-12514异常
在使用Datagurd broker进行Datagurd主备切换时报ORA-12514监听异常, 详细信息如下: DGMGRL> switchover to xiaohe; Performing ...
[Pandas] 06 - Data Preprocessing and Cleaning
From: DBWangGroup 基于该系列代码的实践与补充思考. 补充:特征工程结合:[Scikit-learn] 4.3. Preprocessing data /* implement */

02-15 Logistic回归(鸢尾花分类)