作者的解读,讲得非常好非常推荐:https://zhuanlan.zhihu.com/p/44958351

这篇文章提出的嵌套U-Net结构,也是用于医学图像分割的。但理论上能用于广泛的视觉任务。

1. 故事

U-Net和FCN是应用最广泛的图像分割网络。它们的共同点是:短连接或短拼接,使得解码器可以分享来自编码器的浅层的、low-level的、细粒(fine-grained)的特征图。这种短连接对于恢复细粒度细节有益。甚至对于instance-level的分割,比如目标检测,这种U型结构也被成功应用于诸如Mask-RCNN结构上。Mask-RCNN甚至能处理被遮挡的目标。

但我们要提出一个问题:这种U型结构能不能更优化?因为对于医学图像而言,分割的细节和精度非常重要。

更进一步,作者希望能加强这种短连接结构。因为短连接能够有效地将 细粒度细节 与 语义丰富的特征图 结合。前者是从编码端获取的,后者是从解码端获取的。

2. UNet++

  • 主干网络是可以任选的。

  • 网络内部不仅有稠密连接,也保留了原U-Net的长距离连接。作者认为这很重要。这里作者所谓的connection其实是concat。横向看类似于dense block。

  • U型看,该网络嵌套了不同scale级别的U-Net。作者在解读中说:既然我们不知道深度多少最好,我们干脆全都提供,让网络自己选择好了。

  • 网络采用深监督,即每个输出都直接关联至损失函数。这样,我们可以在测试阶段实现剪裁效果。具体参见作者解读。这样,我们就可以在速度和精度上进行权衡,选择不同scale级别的U-Net。

3. 实验

3.1 设置

  • Adam优化器,初始学习率为3e-4。

  • UNet++是在U-Net的基础上改造的。

  • loss是binary交叉熵和dice coefficient的组合。

实验结果略。是医学图像分割的实验结果。我们重点看看能否实现剪裁:

(b)是相对难的任务,参数越多,U-Net scale级别越高,性能越好。但在简单任务上,可以用很小的U-Net实现较好的效果。

Paper | UNet++: A Nested U-Net Architecture for Medical Image Segmentation的更多相关文章

  1. Paper | U-Net: Convolutional Networks for Biomedical Image Segmentation

    目录 故事背景 U-Net 具体结构 损失 数据扩充 发表在2015 MICCAI.原本是一篇医学图像分割的论文,但由于U-Net杰出的网络设计,得到了8k+的引用. 摘要 There is larg ...

  2. 论文阅读笔记十八:ENet: A Deep Neural Network Architecture for Real-Time Semantic Segmentation(CVPR2016)

    论文源址:https://arxiv.org/abs/1606.02147 tensorflow github: https://github.com/kwotsin/TensorFlow-ENet ...

  3. 论文研读Unet++

    Unet++: A Nested U-Net Architecture for Medical Image Segmentation Unet++ 论文地址 这里仅进行简要介绍,可供读者熟悉其结构与特 ...

  4. 【Semantic Segmentation】U-Net: Convolutional Networks for Biomedical Image Segmentation 论文解析(转)

    目录 0. 前言 1. 第一篇 2. 第二篇 3. 第三篇keras实现 4. 一篇关于U-Net的改进 0. 前言   今天读了U-Net觉得很不错,同时网上很多很好很详细的讲解,因此就不再自己写一 ...

  5. 【Network Architecture】Densely Connected Convolutional Networks 论文解析

    目录 0. Paper link 1. Overview 2. DenseNet Architecture 2.1 Analogy to ResNet 2.2 Composite function 2 ...

  6. U-net图像分割

    [Keras]基于SegNet和U-Net的遥感图像语义分割 2014 年,加州大学伯克利分校的 Long 等人提出全卷积网络(FCN),这使得卷积神经网络无需全连接层即可进行密集的像素预测,CNN ...

  7. Research Guide for Neural Architecture Search

    Research Guide for Neural Architecture Search 2019-09-19 09:29:04 This blog is from: https://heartbe ...

  8. paper 156:专家主页汇总-计算机视觉-computer vision

    持续更新ing~ all *.files come from the author:http://www.cnblogs.com/findumars/p/5009003.html 1 牛人Homepa ...

  9. paper 141:some paper with ComputerCV、MachineLearning[转]

    copy from:http://blog.csdn.net/zouxy09/article/details/8550952 一.特征提取Feature Extraction: ·         S ...

随机推荐

  1. 解决java poi导出excel2003不能超过65536行的问题

    java poi在导出数据到excel2003工作表中时一个工作表只能存储65536行数据,如果超过这个数据就会失败,excel2007并没有这个问题,但是为了兼容性我们通常都是导出到2003版本上的 ...

  2. ASP.NET Core 集成测试中模拟登录用户的一种姿势

    不管哪种用户验证方式,最终都是在验证成功后设置 HttpContext.User ,后续处理环节通过 HttpContext.User 获取用户信息.如果能直接修改 HttpContext.User ...

  3. LeetCode 350: 两个数组的交集 II Intersection of Two Arrays II

    题目: 给定两个数组,编写一个函数来计算它们的交集. Given two arrays, write a function to compute their intersection. 示例 1: 输 ...

  4. 《细说PHP》第四版 样章 第18章 数据库抽象层PDO 9

    18.7  PDO的事务处理 事务是确保数据库一致的机制,是一个或一系列的查询,作为一个单元的一组有序的数据库操作.如果组中的所有SQL语句都操作成功,则认为事务成功,那么事务被提交,其修改将作用于所 ...

  5. php中trait的使用方法

    1.php中的trait是啥? 看上去既像类又像接口,其实都不是,Trait可以看做类的部分实现,可以混入一个或多个现有的PHP类中,其作用有两个:表明类可以做什么:提供模块化实现.Trait是一种代 ...

  6. ElasticStack的入门学习

    Beats,Logstash负责数据收集与处理.相当于ETL(Extract Transform Load).Elasticsearch负责数据存储.查询.分析.Kibana负责数据探索与可视化分析. ...

  7. Python爬虫反反爬:CSS反爬加密彻底破解!

    刚开始搞爬虫的时候听到有人说爬虫是一场攻坚战,听的时候也没感觉到特别,但是经过了一段时间的练习之后,深以为然,每个网站不一样,每次爬取都是重新开始,所以,爬之前谁都不敢说会有什么结果. 前两天,应几个 ...

  8. HTML常用标签三

    表格标签 表格的作用 表格主要用于显示.展示数据,因为他们可以让数据显示的非常规整,可读性非常好,特别是后台展示数据的时候,能够熟练运用表格就先的很重要,一个清爽简约的表格能够把繁杂的数据表现的很有条 ...

  9. react网页版聊天|仿微信、微博web版|react+pc端仿微信实例

    一.项目介绍 基于react+react-dom+react-router-dom+redux+react-redux+webpack2.0+nodejs等技术混合开发的仿微信web端聊天室react ...

  10. CSS3/CSS之居中解析(水平+垂直居中、水平居中,垂直居中)

    首先,我们来看下垂直居中: (1).如果是单行文本,则可以设置的line-height的数值,让其等于父级元素的高度! <!DOCTYPE html> <html lang=&quo ...