cs231n spring 2017 lecture11 Detection and Segmentation 听课笔记

1. Semantic Segmentation

　　把每个像素分类到某个语义。

　　为了减少运算量，会先降采样再升采样。降采样一般用池化层，升采样有各种“Unpooling”、“Transpose Convolution”（文献中也叫“Upconvolution”之类的其他名字）。

　　这个问题的训练数据的获得非常昂贵，因为需要一个像素一个像素的贴标签。

2. Classification + Localizatoin

　　一般用同一个网络，一方面得出分类，一方面得出Bounding box的位置和大小。

3. Object Detection

　　预先设定好要找哪些objects，一旦图片里发现，就框出来。Classification + Localizatoin一般是针对单个物体，而这里是针对多个物体。

　　Sliding window：计算量太大，舍弃。

　　Region Proposals：先找可能有物体的图片区域，然后一个个处理，在CPU上大概几秒的时间。这种方法在深度学习之前就出来了。

　　R-CNN：先找出region proposal，然后把region proposal调整成神经网络需要的大小，然后给神经网络计算，最后通过SVM分类。

　　　　　　训练很慢（84h），也非常耗内存。预测也很慢（47秒 VGG16）

　　Fast R-CNN：相比R-CNN快很多，训练（8.75h），预测（计算region proposal花2秒，神经网络预测花0.32秒）。

　　　　　　　　训练的时候把下图中的Linear + softmax和Linear加起来得到multi-task loss。

　　Faster R-CNN：用卷积层去预测region proposal。比Fast R-CNN更快，预测耗时0.2秒。

　　YOLO（Redmon et al., CVPR 2016）/SSD（Liu et al, "Single-Shot MultiBox Detecotr", ECCV 2016）：这两种方法没有用region proposal，更快，但是相对不那么准。Faster R-CNN更慢，但是更准。

　　Object Detection + Captioning （DenseCap， CVPR 2016）

4. Instance Segmentation

　　Semantic Segmentation和Object Detection的结合，找出多个物体，并且判断每个像素属于哪个分类。

　　Mask R-CNN （He et al., 2017），网络有两个分支，第一个执行Object Detection，第二个执行Semantic Segmentation。这个网络把之前的都融合起来，是集大成者，表现非常非常好。在Object Detection分支加入对人体关节的识别，还能识别人的pose。基于Faster R-CNN，接近real-time。

cs231n spring 2017 lecture11 Detection and Segmentation 听课笔记的更多相关文章

cs231n spring 2017 lecture11 Detection and Segmentation
1. Semantic Segmentation 把每个像素分类到某个语义. 为了减少运算量,会先降采样再升采样.降采样一般用池化层,升采样有各种“Unpooling”.“Transpose Conv ...
cs231n spring 2017 lecture12 Visualizing and Understanding 听课笔记
这一节课很零碎. 1. 神经网络到底在干嘛? 浅层的是具体的特征(比如边.角.色块等),高层的更抽象,最后的全连接层是把图片编码成一维向量然后和每一类标签作比较.如果直接把图片和标签做像素级的最近领域 ...
cs231n spring 2017 lecture10 Recurrent Neural Networks 听课笔记
(没太听明白,下次重新听一遍) 1. Recurrent Neural Networks
cs231n spring 2017 lecture8 Deep Learning Networks 听课笔记
1. CPU vs. GPU: CPU核心少(几个),更擅长串行任务.GPU有很多核心(几千个),每一个核都弱,有自己的内存(几个G),很适合并行任务.GPU最典型的应用是矩阵运算. GPU编程:1) ...
cs231n spring 2017 lecture5 Convolutional Neural Networks听课笔记
1. 之前课程里,一个32*32*3的图像被展成3072*1的向量,左乘大小为10*3072的权重矩阵W,可以得到一个10*1的得分,分别对应10类标签. 在Convolution Layer里,图像 ...
cs231n spring 2017 lecture9 CNN Architectures 听课笔记
参考<deeplearning.ai 卷积神经网络 Week 2 听课笔记>. 1. AlexNet(Krizhevsky et al. 2012),8层网络. 学会计算每一层的输出的sh ...
cs231n spring 2017 lecture9 CNN Architectures
参考<deeplearning.ai 卷积神经网络 Week 2 听课笔记>. 1. AlexNet(Krizhevsky et al. 2012),8层网络. 学会计算每一层的输出的sh ...
cs231n spring 2017 lecture13 Generative Models 听课笔记
1. 非监督学习监督学习有数据有标签,目的是学习数据和标签之间的映射关系.而无监督学习只有数据,没有标签,目的是学习数据额隐藏结构. 2. 生成模型(Generative Models) 已知训练数 ...
cs231n spring 2017 lecture7 Training Neural Networks II 听课笔记
1. 优化: 1.1 随机梯度下降法(Stochasitc Gradient Decent, SGD)的问题: 1)对于condition number(Hessian矩阵最大和最小的奇异值的比值)很 ...

随机推荐

【二十一】基于mysqli的表格数据练习
mysqlitest.php <?php //调用数据库的函数 function connetionsql(){ $conn=mysqli_connect("127.0.0.1&quo ...
统计nginx单个IP访问日志并获取IP来源
#!/usr/bin/env python #coding=utf-8 import requests from urllib2 import urlopen # import lxml.html f ...
JavaScript的简单入门
一.导读简介:JavaScript简称js,是基于对象和事件驱动的脚本语言,主要运用于客户端.原名LiveScript,本身和Java没有任何关系,但语法上很类似. 特点:交互性(它可以做的就是信息 ...
Docker安装入门 -- 应用镜像
Docker安装入门 -- 应用镜像 WordPress 1.docker build -t csphere/wordpress:4.2 . 2.docker run -d -p 80:80 -- ...
c#加密解密源码，md5、des、rsa
从网上找来的代码,顺手改改,用起来更方便. 配置文件 using System; using System.Collections.Generic; using System.Text; using ...
jquery学习总结（超级详细）
本文仅针对jquery的部分知识点做总结,更为全面的可以去官网看中文文档.可以更为详细的了解jquery及其特性. window.onload $(document).ready() 执行 ...
使用linux perf工具生成java程序火焰图
pre.cjk { font-family: "Nimbus Mono L", monospace } p { margin-bottom: 0.1in; line-height: ...
SQL语言的分类
本文转自https://www.cnblogs.com/fjfzhkb/archive/2007/10/18/929108.html SQL语言共分为四大类:数据查询语言DQL,数据操纵语言DML, ...
flex盒模型详细解析
flex盒模型详细解析移动端页面布局,采用盒模型布局,效果很好 /* ============================================================ ...
thinkphp->add方法错误
$group_id=$model->add($add); 以上这句代码如果执行成功,返回它存储的id,但是,会有一种情况一直返回1. 代码完全没有问题,检查数据库发现有两个主键id,删除一个就O ...

cs231n spring 2017 lecture11 Detection and Segmentation 听课笔记

cs231n spring 2017 lecture11 Detection and Segmentation 听课笔记的更多相关文章

随机推荐

热门专题