图像分割中的loss--处理数据极度不均衡的状况

序言：

对于小目标图像分割任务，一副图画中往往只有一两个目标，这样会加大网络训练难度，一般有三种方法解决：

1、选择合适的loss，对网络进行合理优化，关注较小的目标。

2、改变网络结构，使用attention机制。

3、类属attention机制，即先检测目标区域，裁剪后再分割训练。

场景：

现在以U-net网络为基础，使用keras进行实现小目标的分割。

Loss函数：

1、Log loss

对于二分类任务，log loss如下：

其中，yi为输入实例xixi的真实类别, pi为预测输入实例 xi属于类别 1 的概率。对所有样本的对数损失表示对每个样本的对数损失的平均值。

这个loss函数每一次梯度的回传对每一个类别具有相同的关注度，所以容易受到类别不平衡的影响。

这种情况参照airbus-ship-detection。这个任务是检测海面上的船只，整个图片中大海占幅较大，所以采用一些技巧：使用montage拼接图片，对只有大海的图片进行采样来减少图片大小。

2、WCE loss(weighted cross-entropy)

带权重的交叉熵

二分类WCE：

这个loss的缺点时需要人为的调整困难样本的权重，增加调整难度。

3、Focal loss

能否使网络主动学习困难样本呢？

focal loss的提出是在目标检测领域，为了解决正负样本比例严重失调的问题。

focal函数公式：

对比上面其实就是多了 (1-pi)^r 。

loss值随样本概率变大而变小。

基本思想是，对于类别极度不平衡的情况下，网络如果在log loss下会倾向只预测负样本，并且负样本的预测概率会非常高，回传的梯度也很大。

但是如果添加了上述项，则focal 函数会使预测概率大的样本的loss变小，而预测概率小的样本的loss变大，从而加强了对正样本的关注度。

from keras import backend as K

'''

Compatible with tensorflow backend

'''

def focal_loss(gamma=2., alpha=.25):

    def focal_loss_fixed(y_true, y_pred):

        pt_1 = tf.where(tf.equal(y_true, 1), y_pred, tf.ones_like(y_pred))

            pt_0 = tf.where(tf.equal(y_true, 0), y_pred, tf.zeros_like(y_pred))

            return -K.sum(alpha * K.pow(1. - pt_1, gamma) * K.log(pt_1))-K.sum((1-alpha) * K.pow( pt_0, gamma) * K.log(1. - pt_0))

return focal_loss_fixed

model_prn.compile(optimizer=optimizer, loss=[focal_loss(alpha=.25, gamma=2)])

使用U-net输入输出都是一张图，直接使用会导致loss值很大。而且调参alpha和gamma也麻烦。

4、Dice loss

直观理解为两个轮廓的相似程度。

或则表示为：

二分类的dice loss:

def dice_coef(y_true, y_pred, smooth=1):

    intersection = K.sum(y_true * y_pred, axis=[1,2,3])

    union = K.sum(y_true, axis=[1,2,3]) + K.sum(y_pred, axis=[1,2,3])

    return K.mean( (2. * intersection + smooth) / (union + smooth), axis=0) 

def dice_coef_loss(y_true, y_pred):

    1 - dice_coef(y_true, y_pred, smooth=1)

使用dice loss有时会不可信，原因是对于sofemax或log loss其梯度简言之是p-t ，t为目标值，p为预测值。而dice loss 为 2t² / (p+t)²

如果p，t过小会导致梯度变化剧烈，导致训练困难。

5、IOU loss

类比dice loss，IOU函数公式：

def IoU(y_true, y_pred, eps=1e-6):

    if np.max(y_true) == 0.0:

        return IoU(1-y_true, 1-y_pred) ## empty image; calc IoU of zeros

    intersection = K.sum(y_true * y_pred, axis=[1,2,3])

    union = K.sum(y_true, axis=[1,2,3]) + K.sum(y_pred, axis=[1,2,3]) - intersection

    return -K.mean( (intersection + eps) / (union + eps), axis=0)

IOU loss的缺点呢同DICE loss是相类似的，训练曲线可能并不可信，训练的过程也可能并不稳定，有时不如使用softmax loss等的曲线有直观性，通常而言softmax loss得到的loss下降曲线较为平滑。

6、Tversky loss

Tversky loss使dice系数和jaccard系数的一种广义系数。

观察可得当设置α=β=0.5，此时Tversky系数就是Dice系数。

而当设置α=β=1时，此时Tversky系数就是Jaccard系数。

∣A−B∣则意味着是FP（假阳性），而∣B−A∣则意味着是FN（假阴性）；α和β分别控制假阴性和假阳性。通过调整α和β我们可以控制假阳性和假阴性之间的权衡。

def tversky(y_true, y_pred):

    y_true_pos = K.flatten(y_true)

    y_pred_pos = K.flatten(y_pred)

    true_pos = K.sum(y_true_pos * y_pred_pos)

    false_neg = K.sum(y_true_pos * (1-y_pred_pos))

    false_pos = K.sum((1-y_true_pos)*y_pred_pos)

    alpha = 0.7

    return (true_pos + smooth)/(true_pos + alpha*false_neg + (1-alpha)*false_pos + smooth)

def tversky_loss(y_true, y_pred):

    return 1 - tversky(y_true,y_pred)

def focal_tversky(y_true,y_pred):

    pt_1 = tversky(y_true, y_pred)

    gamma = 0.75

    return K.pow((1-pt_1), gamma)

7、敏感性-特异性loss

首先敏感性就是召回率，检测出确实有病的能力：

特异性，检测出确实没病的能力：

综合

其中左边为病灶像素的错误率即，1−Sensitivity，而不是正确率，所以设置λ 为0.05。其中(rn−pn)2是为了得到平滑的梯度。

8、Generalized dice loss

在使用DICE loss时，对小目标是十分不利的，因为在只有前景和背景的情况下，小目标一旦有部分像素预测错误，那么就会导致Dice大幅度的变动，从而导致梯度变化剧烈，训练不稳定。

当病灶分割有多个区域时，一般针对每一类都会有一个DICE，而Generalized Dice index将多个类别的dice进行整合，使用一个指标对分割结果进行量化。

GDL公式：

其中rln为类别l在第n个像素的标准值(GT)，而pln为相应的预测概率值。此处最关键的是wl，为每个类别的权重。其中

这样，GDL就能平衡病灶区域和Dice系数之间的平衡。

def generalized_dice_coeff(y_true, y_pred):

    Ncl = y_pred.shape[-1]

    w = K.zeros(shape=(Ncl,))

    w = K.sum(y_true, axis=(0,1,2))

    w = 1/(w**2+0.000001)

    # Compute gen dice coef:

    numerator = y_true*y_pred

    numerator = w*K.sum(numerator,(0,1,2,3))

    numerator = K.sum(numerator)

    denominator = y_true+y_pred

    denominator = w*K.sum(denominator,(0,1,2,3))

    denominator = K.sum(denominator)

    gen_dice_coef = 2*numerator/denominator

    return gen_dice_coef

def generalized_dice_loss(y_true, y_pred):

    return 1 - generalized_dice_coeff(y_true, y_pred)

以上本质上都是根据评测标准设计的loss function，有时候普遍会受到目标太小的影响，导致训练的不稳定；对比可知，直接使用log loss等的loss曲线一般都是相比较光滑的。

9、BCE + dice loss（BCE : Binary Cross Entropy）

说白了，添加二分类交叉熵损失函数。在数据较为平衡的情况下有改善作用，但是在数据极度不均衡的情况下，交叉熵损失会在几个训练之后远小于Dice 损失，效果会损失。

import keras.backend as K

from keras.losses import binary_crossentropy

def dice_coef(y_true, y_pred, smooth=1):

    intersection = K.sum(y_true * y_pred, axis=[1,2,3])

    union = K.sum(y_true, axis=[1,2,3]) + K.sum(y_pred, axis=[1,2,3])

    return K.mean( (2. * intersection + smooth) / (union + smooth), axis=0)

def dice_p_bce(in_gt, in_pred):

    return 1e-3*binary_crossentropy(in_gt, in_pred) - dice_coef(in_gt, in_pred)

图像分割中的loss--处理数据极度不均衡的状况的更多相关文章

（转载）人脸识别中Softmax-based Loss的演化史
人脸识别中Softmax-based Loss的演化史旷视科技近期,人脸识别研究领域的主要进展之一集中在了 Softmax Loss 的改进之上:在本文中,旷视研究院(上海)(MEGVII Re ...
分享一个SQLSERVER脚本（计算数据库中各个表的数据量和每行记录所占用空间）
分享一个SQLSERVER脚本(计算数据库中各个表的数据量和每行记录所占用空间) 很多时候我们都需要计算数据库中各个表的数据量和每行记录所占用空间这里共享一个脚本 CREATE TABLE #tab ...
struts2中从后台读取数据到<s:select>
看到网上好多有struts2中从后台读取数据到<s:select>的,但都不太详细,可能是我自己理解不了吧!所以我自己做了一个,其中可能有很多不好的地方,望广大网友指出结果如图 p ...
定时器中实现数据库表数据移动的功能，Exception in thread "Timer-0" isExist java.lang.NullPointerException定时器中线程报错。
package com.shawnway.trade.marketdata.constants; import java.sql.SQLException; import java.util.Cale ...
WPF中Grid绑定DataTable数据。
1.首先引用DocumentFormat.OpenXml.dll 2.然后新建一个OpenExcelHelper类,将Excel转化为Datatable. /// <summary> ...
input中空格后的数据不显示
bug,input中空格后的数据不显示昨天在修bug,有一个bug是用户修改的个人信息的地址栏,输入有空格的话,空格后面的内容存不上,而且没有报错,奇怪了,只好跟踪下. 页面上的输入框就是个 ...
Dynamics AX 2012 R2 SSRS报表在VS2010中预览没有数据
今天,Reinhard 在VS中制作SSRS报表,预览的时候发现显示不出数据. 仔细检查了数据处理环节和临时表里的数据,都发现没有问题. 用同事的账号登陆同样的开发环境,发现他的账号可以在VS中预览到 ...
在SQL SERVER中获取表中的第二条数据
在SQL SERVER中获取表中的第二条数据, 思路:先根据时间逆排序取出前2条数据作为一个临时表,再按顺时排序在临时表中取出第一条数据 sql语句如下: select top 1 * from(se ...
SpringMVC中使用Json传数据
在web项目中使用Json进行数据的传输是非常常见且有用的,在这里介绍下在SpringMVC中使用Json传数据的一种方法,在我的使用中,主要包括下面四个部分(我个人喜好使用maven这类型工具进行项 ...

随机推荐

BIO、NIO、AIO入门认识
同步.异步.阻塞.非阻塞概念理解. 同步: 比如在执行某个逻辑业务,在没有得到结果之前一直处于等待阻塞状态,得到结果后才继续执行异步: 比如在执行某个逻辑业务,在没有得到结果可以去干其他的事情,等待 ...
Servlet & Filter 执行原理
一.Servlet的两个Map 当请求到达后,web容器是如何查找Servlet的呢?执行流程又是什么? 可能很多人和我一样,只知道在web,xml中配置拦截规则,然后反射+映射就完事了? 当Serv ...
模块化开发(requireJS)
模块化在前端使用模块化开发,可以将代码根据功能实施模块的划分,每个模块功能(职责)单一,在需要更改对应的功能的时候,只需要对指定的模块进行修改,其他模块不受任何影响. 为什么要进行前端模块化? 达到 ...
巧用android:divider属性设置LinearLayout中元素之间的间隔
如上图,要想实现3个button线性排列并且使它们的大小相同.间隔相等.而且整体填充满整个linearlayout,我们一般的做法是在每两个button之间放一个固定宽度的view,然后设置butto ...
getResourceAsStream的几种路径配置（properties文件的路径问题）
文章目录 getResourceAsStream有以下几种: getResourceAsStream有以下几种: Class.getResourceAsStream(String path) : pa ...
结合sessionStorage解决vuex页面刷新数据丢失的问题
将需要保存在vuex中的数据同时保存在sessionStorage中即可: import Vue from 'vue'; import Vuex from 'vuex'; Vue.use(Vuex); ...
vue-router使用入门
安装及基本配置 # 安装 npm install vue-router # 使用 import Vue from 'vue' import VueRouter from 'vue-router' Vu ...
Asp.Net中的HttpWebRequest类与HttpWebResponse类
相关博文:https://www.cnblogs.com/xu-yi/p/10061342.html 相关博文:https://www.cnblogs.com/zoujinhua/p/11313396 ...
WPF实现Drag/Drop操作
原文:WPF实现Drag/Drop操作有时候我们方便用户操作,总会把一下Copy/Paste 或者 input操作转换为Drag/Drop, WPF 跟之前WinForm 一样提供了一些实现方式方便 ...
Entity Framework Code First 模式-建立一对多联系
一.建立一对多联系使用的例子为Product与Category,一个种类(Product)对应多个商品(Product) 1.外键列名默认约定在“一”这边的实体增加一个集合属性(public vi ...

图像分割中的loss--处理数据极度不均衡的状况

图像分割中的loss--处理数据极度不均衡的状况的更多相关文章

随机推荐

热门专题