分类模型评估中，通过各类损失（loss）函数的分析，可以衡量模型预测结果与真实值之间的差异。
不同的损失函数可用于不同类型的分类问题，以便更好地评估模型的性能。

本篇将介绍分类模型评估中常用的几种损失计算方法。

1. 汉明损失

Hamming loss（汉明损失）是一种衡量分类模型预测错误率的指标。
它直接衡量了模型预测错误的样本比例，因此更直观地反映出模型的预测精度，
而且，它对不平衡数据比较敏感，也适用于多分类的问题，不仅限于二分类问题。

1.1. 计算公式

\(L(y, \hat{y}) = \frac{1}{n * m} \sum_{i=0}^{n-1} \sum_{j=0}^{m - 1} 1(\hat{y}_{i,j} \not= y_{i,j})\)
其中，\(n\)是样本数量，\(m\)是标签数量，\(y_{i,j}\)是样本\(i\)的第\(j\)个标签的真实值，\(\hat{y}_{i,j}\)是对应的预测值，
\(1(x)\) 是指示函数。

1.2. 使用示例

from sklearn.metrics import hamming_loss

import numpy as np

n = 100

y_true = np.random.randint(1, 10, n)

y_pred = np.random.randint(1, 10, n)

s = hamming_loss(y_true, y_pred)

print("hamming loss：{}".format(s))

# 运行结果

hamming loss：0.8

2. 铰链损失

Hinge loss（铰链损失）常用于“最大间隔”分类，其最著名的应用是作为支持向量机（SVM）的目标函数。
Hinge loss主要用于二分类问题，并且通常与特定的算法（如SVM）结合使用。

2.1. 计算公式

\(L(y, w) = \frac{1}{n} \sum_{i=0}^{n-1} \max\left\{1 - w_i y_i, 0\right\}\)
其中，\(n\)是样本数量，\(y_i\)是真实值， \(w_i\)是相应的预测决策（由 decision_function 方法输出）。

2.2. 使用示例

from sklearn.metrics import hinge_loss

from sklearn.svm import LinearSVC

from sklearn.model_selection import train_test_split

import numpy as np

n = 100

X = np.random.randint(0, 2, size=(n, 1))

y = np.random.randint(0, 2, n)

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.1)

reg = LinearSVC(dual="auto")

reg.fit(X_train, y_train)

y_pred_decision = reg.decision_function(X_test)

s = hinge_loss(y_test, y_pred_decision)

print("hinge loss：{}".format(s))

# 运行结果

hinge loss：1.0136184446302712

上面的示例中，首先构建一个支持向量机的训练模型和随机的样本数据。
最后在测试集上计算hinge loss。

3. 对数损失

对数损失（log loss）通过考虑模型预测的概率与实际标签的对数误差来评估模型的性能。
它特别关注模型对于每个样本的预测概率的准确性，对于错误的分类，Log loss会给予较大的惩罚。

对数损失的值越小，表示模型的预测概率越接近实际标签，模型的性能越好。

3.1. 计算公式

\(LL = - \frac{1}{N} \sum_{i=0}^{N-1} \sum_{k=0}^{K-1} y_{i,k} \log p_{i,k}\)
其中，\(N\)是样本数量，\(K\)是分类标签的数量，
\(y_{i,k}\)是第\(i\)个样本在标签\(k\)上的真实值，\(p_{i,k}\)是对应的概率估计。

3.2. 使用示例

from sklearn.metrics import log_loss

import numpy as np

n = 100

k = 10

y_true = np.random.randint(0, k, n)

y_prob = np.random.rand(n, k)

# 这一步转换后，

# y_prob 每一行的和都为1

for i in range(len(y_prob)):

    y_prob[i, :] = y_prob[i, :] / np.sum(y_prob[i, :])

s = log_loss(y_true, y_prob)

print("log loss：{}".format(s))

# 运行结果

log loss：2.6982702715125466

上面的示例中，\(n\)是样本数量，\(k\)是标签数量。

4. 零一损失

零一损失（zero-one loss）非常直观，直接对应着分类判断错误的个数，能很清晰地反映出模型预测错误的比例。
它计算简单，易于理解和实现，对于二分类问题特别直观，但是对于非凸性质不太适用。

4.1. 计算公式

\(L(y, \hat{y}) = \frac{1}{n} \sum_{i=0}^{n-1} 1(\hat{y}_i \not= y_i)\)
其中，\(n\)是样本数量，\(y_i\)是真实值，\(\hat{y_i}\)是预测值，
\(1(x)\) 是指示函数。

4.2. 使用示例

from sklearn.metrics import zero_one_loss

import numpy as np

n = 100

y_true = np.random.randint(1, 10, n)

y_pred = np.random.randint(1, 10, n)

s1 = zero_one_loss(y_true, y_pred)

s2 = zero_one_loss(y_true, y_pred, normalize=False)

print("zero-one loss比率：{}\nzero-one loss数量：{}".format(s1, s2))

# 运行结果

zero-one loss比率：0.89

zero-one loss数量：89

5. Brier 分数损失

Brier 分数损失（Brier score loss）关注模型预测的概率与实际结果之间的差异。
与只关注预测类别的其他指标不同，它衡量了预测概率的可靠性；
与一些仅适用于二分类问题的评估指标相比，Brier score loss可以应用于多类别分类问题。

它的数值越小，表示模型的概率预测越准确，具有很好的解释性。

5.1. 计算公式

\(BS = \frac{1}{n} \sum_{i=0}^{n - 1}(y_i - p_i)^2\)
其中，\(n\)是样本数量，\(y_i\)是真实值，\(p_i\)是预测概率估计的均方误差。

5.2. 使用示例

from sklearn.metrics import brier_score_loss

import numpy as np

n = 100

y_true = np.random.randint(0, 2, n)

y_prob = np.random.rand(n)

s = brier_score_loss(y_true, y_prob)

print("brier score loss：{}".format(s))

# 运行结果

brier score loss：0.3141953858083935

示例中计算损失用的模拟数据中，y_true表示真实值，y_prob表示预测概率的均方误差。

6. 总结

本篇归纳总结了分类模型中关于损失函数的一些使用方式：

汉明损失，Hamming loss
铰链损失，Hinge loss
对数损失，log loss
零一损失，zero one loss
Brier 分数损失，Brier score loss

【scikit-learn基础】--『回归模型评估』之损失分析的更多相关文章

(原创)（四）机器学习笔记之Scikit Learn的Logistic回归初探
目录 5.3 使用LogisticRegressionCV进行正则化的 Logistic Regression 参数调优一.Scikit Learn中有关logistics回归函数的介绍 1. 交叉 ...
机器学习之路：python 集成回归模型随机森林回归RandomForestRegressor 极端随机森林回归ExtraTreesRegressor GradientBoostingRegressor回归预测波士顿房价
python3 学习机器学习api 使用了三种集成回归模型 git: https://github.com/linyi0604/MachineLearning 代码: from sklearn.dat ...
Poisson回归模型
Poisson回归模型也是用来分析列联表和分类数据的一种方法,它实际上也是对数线性模型的一种,不同点是对数线性模型假定频数分布为多项式分布,而泊松回归模型假定频数分布为泊松分布. 首先我们来认识一下泊 ...
(原创)（三）机器学习笔记之Scikit Learn的线性回归模型初探
一.Scikit Learn中使用estimator三部曲 1. 构造estimator 2. 训练模型:fit 3. 利用模型进行预测:predict 二.模型评价模型训练好后,度量模型拟合效果的 ...
逻辑回归模型(Logistic Regression, LR)基础
逻辑回归模型(Logistic Regression, LR)基础逻辑回归(Logistic Regression, LR)模型其实仅在线性回归的基础上,套用了一个逻辑函数,但也就由于这个逻辑函 ...
『高性能模型』轻量级网络ShuffleNet_v1及v2
项目实现:GitHub 参考博客:CNN模型之ShuffleNet v1论文:ShuffleNet: An Extremely Efficient Convolutional Neural Netwo ...
回归模型效果评估系列1-QQ图
(erbqi)导语 QQ图全称 Quantile-Quantile图,也就是分位数-分位数图,简单理解就是把两个分布相同分位数的值,构成点(x,y)绘图:如果两个分布很接近,那个点(x,y)会分布在y ...
『高性能模型』HetConv: HeterogeneousKernel-BasedConvolutionsforDeepCNNs
论文地址:HetConv 一.现有网络加速技术 1.卷积加速技术作者对已有的新型卷积划分如下:标准卷积.Depthwise 卷积.Pointwise 卷积.群卷积(相关介绍见『高性能模型』深度可分离 ...
『高性能模型』轻量级网络MobileNet_v2
论文地址:MobileNetV2: Inverted Residuals and Linear Bottlenecks 前文链接:『高性能模型』深度可分离卷积和MobileNet_v1 一.Mobil ...
20165308『网络对抗技术』Exp5 MSF基础应用
20165308『网络对抗技术』Exp5 MSF基础应用一.原理与实践说明实践内容本实践目标是掌握metasploit的基本应用方式,重点常用的三种攻击方式的思路.具体需要完成: 一个主动攻击实 ...

随机推荐

为什么我要迁移SpringBoot到函数计算
前言为什么要迁移? 我们的业务有很多对外提供服务的 RESTful API,并且要执行很多不同的任务,例如同步连锁 ERP 中的商品信息到美团/饿了么等平台,在线开发票等.由于各种 API 和任务执 ...
mybatis-plus 对date类型取当天的数据
数据库中的字段是时间类型,要取出当天的数据,使用mybatis-plus 如何实现,思路是用时间大于当天凌晨,小于当天23:59:59的时间 //调用的代码Date start = DateUtil ...
XSS、CSRF 以及如何防范
freeswitch的distributor模块
概述 freeswitch 是一款简单好用的VOIP开源软交换平台. 当呼叫是同一个入中继,但是有多条出中继时,需要对出中继做负载均衡,mod_distributor模块可以完成对应的配置和路由. m ...
斐波拉契序列的 Go 实现
本篇文章主要介绍斐波拉契序列的 Go 语言实现. 斐波拉契序列: 前面相邻两项之后构成后一项. 1. 循环迭代 package main import "fmt" const ma ...
TICK 中Kapacitor功能和使用说明
转载请注明出处: 1.Kapacitor 简介 Kapacitor是InfluxData公司开发的一个实时流数据处理引擎.它可以实时地通过TICK脚本处理InfluxDB中的流数据以及批处理数据. K ...
golang将字符串进行md5加密
最近写项目要把登录密码进行md5加密保存,在golang里面的写法略有不同,再次记录一下. package main import ( "crypto/md5" "enc ...
PS去除PDF中的WPS 编辑试用水印
1. 问题自己的学习资料.pdf被添加上了相关水印,导致阅读起来很不舒服 2. 解决方式(适用于白底黑字的pdf资料,去除水印) 2.1 初始图片如下: 2.2 打开PS,选择菜单栏中选择一项中的色 ...
神经网络优化篇：详解局部最优的问题(The problem of local optima)
局部最优的问题在深度学习研究早期,人们总是担心优化算法会困在极差的局部最优,不过随着深度学习理论不断发展,对局部最优的理解也发生了改变.向展示一下现在怎么看待局部最优以及深度学习中的优化问题. 这是 ...
结构体Struct、联合体Union与类Class
结构体Struct.联合体Union与类Class 1. Struct/Class struct能包含成员函数吗? 能! struct能继承吗? 能!! struct能实现多态吗? 能!!! 1.1 ...

【scikit-learn基础】--『回归模型评估』之损失分析