更新、更全的《机器学习》的更新网站，更有python、go、数据结构与算法、爬虫、人工智能教学等着你：https://www.cnblogs.com/nickchen121/p/11686958.html

Logistic回归(鸢尾花分类)

一、导入模块

import numpy as np

import matplotlib.pyplot as plt

from matplotlib.colors import ListedColormap

from matplotlib.font_manager import FontProperties

from sklearn import datasets

from sklearn.linear_model import LogisticRegression

%matplotlib inline

font = FontProperties(fname='/Library/Fonts/Heiti.ttc')

二、获取数据

iris_data = datasets.load_iris()

X = iris_data.data[:, [2, 3]]

y = iris_data.target

label_list = ['山鸢尾', '杂色鸢尾', '维吉尼亚鸢尾']

三、构建决策边界

def plot_decision_regions(X, y, classifier=None):

    marker_list = ['o', 'x', 's']

    color_list = ['r', 'b', 'g']

    cmap = ListedColormap(color_list[:len(np.unique(y))])

    x1_min, x1_max = X[:, 0].min()-1, X[:, 0].max()+1

    x2_min, x2_max = X[:, 1].min()-1, X[:, 1].max()+1

    t1 = np.linspace(x1_min, x1_max, 666)

    t2 = np.linspace(x2_min, x2_max, 666)

    x1, x2 = np.meshgrid(t1, t2)

    y_hat = classifier.predict(np.array([x1.ravel(), x2.ravel()]).T)

    y_hat = y_hat.reshape(x1.shape)

    plt.contourf(x1, x2, y_hat, alpha=0.2, cmap=cmap)

    plt.xlim(x1_min, x1_max)

    plt.ylim(x2_min, x2_max)

    for ind, clas in enumerate(np.unique(y)):

        plt.scatter(X[y == clas, 0], X[y == clas, 1], alpha=0.8, s=50,

                    c=color_list[ind], marker=marker_list[ind], label=label_list[clas])

四、训练模型

# C与正则化参数λ成反比，即减小参数C增大正则化的强度

# lbfgs使用拟牛顿法优化参数

# 分类方式为OvR（One-vs-Rest）

lr = LogisticRegression(C=100, random_state=1,

                        solver='lbfgs', multi_class='ovr')

lr.fit(X, y)

LogisticRegression(C=100, class_weight=None, dual=False, fit_intercept=True,

          intercept_scaling=1, max_iter=100, multi_class='ovr',

          n_jobs=None, penalty='l2', random_state=1, solver='lbfgs',

          tol=0.0001, verbose=0, warm_start=False)

4.1 C参数与权重系数的关系

weights, params = [], []

for c in np.arange(-5, 5):

    lr = LogisticRegression(C=10.**c, random_state=1,

                            solver='lbfgs', multi_class='ovr')

    lr.fit(X, y)

    # lr.coef_[1]拿到类别1的权重系数

    weights.append(lr.coef_[1])

    params.append(10.**c)

# 把weights转为numpy数组，即包含两个特征的权重的数组

weights = np.array(weights)

'''

params:

[1e-05, 0.0001, 0.001, 0.01, 0.1, 1.0, 10.0, 100.0, 1000.0, 10000.0]

'''

'''

weights:

[[ 2.50572107e-04  6.31528229e-05]

 [ 2.46565843e-03  6.15303747e-04]

 [ 2.13003731e-02  4.74899392e-03]

 [ 9.09176960e-02 -1.80703318e-03]

 [ 1.19168871e-01 -2.19313511e-01]

 [ 8.35644722e-02 -9.08030470e-01]

 [ 1.60682631e-01 -2.15860167e+00]

 [ 5.13026897e-01 -2.99137299e+00]

 [ 1.14643413e+00 -2.79518356e+00]

 [ 1.90317264e+00 -2.26818639e+00]]

'''

plt.plot(params, weights[:, 0], linestyle='--', c='r', label='花瓣长度（cm）')

plt.plot(params, weights[:, 1], c='g', label='花瓣长度（cm）')

plt.xlabel('C')

# 改变x轴的刻度

plt.xscale('log')

plt.ylabel('权重系数', fontproperties=font)

plt.legend(prop=font)

plt.show()

上图显示了10个不同的逆正则化参数C值拟合逻辑回归模型，此处只收集标签为1（杂色鸢尾）的权重系数。由于数据没有经过处理，所以显示的不太美观，但是总体趋势还是可以看出减小参数C会增大正则化强度，在\(10^{-3}\)的时候权重系数开始收敛为0。

五、可视化

plot_decision_regions(X, y, classifier=lr)

plt.xlabel('花瓣长度（cm）', fontproperties=font)

plt.ylabel('花瓣宽度（cm）', fontproperties=font)

plt.legend(prop=font)

plt.show()

02-15 Logistic回归(鸢尾花分类)的更多相关文章

【2008nmj】Logistic回归二元分类感知器算法.docx
给你一堆样本数据(xi,yi),并标上标签[0,1],让你建立模型(分类感知器二元),对于新给的测试数据进行分类. 要将两种数据分开,这是一个分类问题,建立数学模型,(x,y,z),z指示[0,1], ...
神经网络、logistic回归等分类算法简单实现
最近在github上看到一个很有趣的项目,通过文本训练可以让计算机写出特定风格的文章,有人就专门写了一个小项目生成汪峰风格的歌词.看完后有一些自己的小想法,也想做一个玩儿一玩儿.用到的原理是深度学习里 ...
Logistic回归二分类Winner or Losser----台大李宏毅机器学习作业二(HW2)
一.作业说明给定训练集spam_train.csv,要求根据每个ID各种属性值来判断该ID对应角色是Winner还是Losser(0.1分类). 训练集介绍: (1)CSV文件,大小为4000行X5 ...
《转》Logistic回归多分类问题的推广算法--Softmax回归
转自http://ufldl.stanford.edu/wiki/index.php/Softmax%E5%9B%9E%E5%BD%92 简介在本节中,我们介绍Softmax回归模型,该模型是log ...
如何在R语言中使用Logistic回归模型
在日常学习或工作中经常会使用线性回归模型对某一事物进行预测,例如预测房价.身高.GDP.学生成绩等,发现这些被预测的变量都属于连续型变量.然而有些情况下,被预测变量可能是二元变量,即成功或失败.流失或 ...
机器学习之三：logistic回归(最优化)
一般来说,回归不用在分类问题上,因为回归是连续型模型,而且受噪声影响比较大.如果非要应用进入,可以使用logistic回归. logistic回归本质上是线性回归,只是在特征到结果的映射中加入了一层函 ...
七，专著研读（Logistic回归）
七,专著研读(Logistic回归) 分类:k-近邻算法,决策树,朴素贝叶斯,Logistic回归,支持向量机,AdaBoost算法. 运用 k-近邻算法,使用距离计算来实现分类决策树,构建直观的树 ...
Logistic回归应用-预测马的死亡率
Logistic回归应用-预测马的死亡率本文所有代码均来自<机器学习实战>,数据也是本例中的数据有以下几个特征: 部分指标比较主观.难以很好的定量测量,例如马的疼痛级别数据集中有30 ...
《Machine Learning in Action》—— Taoye给你讲讲Logistic回归是咋回事
在手撕机器学习系列文章的上一篇,我们详细讲解了线性回归的问题,并且最后通过梯度下降算法拟合了一条直线,从而使得这条直线尽可能的切合数据样本集,已到达模型损失值最小的目的. 在本篇文章中,我们主要是手撕 ...

随机推荐

《即时消息技术剖析与实战》学习笔记4——IM系统如何保证消息的可靠性
IM 系统中,保证消息的可靠投递主要体现在两方面,一是消息的不丢失,二是消息的不重复. 一.消息不丢失消息丢失的原因首先看一下发送消息的流程,如下图所示: 消息.可以采取"时间戳比对&q ...
PHPOffice 导入
1.因为Phpexecel已经停止维护,所以要使用心得phpoffice; 2.注意引入 use PhpOffice\PhpSpreadsheet\Helper\Sample; use PhpOffi ...
使用dig/nslookup命令查看dns解析详情
dig-DNS lookup utility 当域名出现访问故障时,可通过域名解析来判断是否有错误的解析导致的问题. 可以看到有请求段和应答段,最后解析出的A记录有两条 dig命令做迭代查询 dig ...
SSL证书部署相关知识总结
证书生成工具,手动:Keymanager工具https://keymanager.org/ 证书服务商集成:可自由获得TrustAsia.Let’s Encrypt颁发的免费证书. Keymanag ...
VUE中CSS样式穿透
VUE中CSS样式穿透 1. 问题由来在做两款H5的APP项目,前期采用微信官方推荐的weui组件库.后来因呈现的效果不理想,组件不丰富,最终项目完成后全部升级采用了有赞开发的vant组件库.同时将 ...
elementUI树状图竖向滚动条和横向滚动条问题
添加样式: <div class="device-tree"> <el-scrollbar style="height:100%"> & ...
.net core Cookie的使用
缘起: 公司领导让我做一个测试的demo,功能大概是这样的:用户通过微信扫一扫登陆网站,如果用户登录过则直接进入主界面,否则就保留在登录界面. 实现方法: 首先先把网站地址生成个二维码,在扫描二维码后 ...
Jsp学习笔记（4）——分页查询
核心sql i是第几页,itemNum是每页显示的数据条数 select * from ( select e.*,rownum rn from ( select * from employee whe ...
MySQL二进制日志分析-代码实现(FORMAT_DESCRIPTION_EVENT)
如前文概述,MySQL Binlog v3以前版本, 二进制日志文件的第一个事件是START_EVENT_V3, 从v4版本开始第一个事件为FORMAT_DESCRIPTION_EVENT(以下简称F ...
cocos 微信小游戏切后台卡住
1.cocos 安装目录下搜索以下代码并注掉opts["preserveDrawingBuffer"] = true;”2.CocosCreator\resources\engin ...

02-15 Logistic回归(鸢尾花分类)