CNN与图像高级应用

stone1234567890 2024-10-21 07:28:57 原文

一、图像识别与定位

　　思路1：视作回归

　　　　4个数字，用L2 loss/欧氏距离损失(x,y,w,h)这四个数都是连续值

　　思路2：借助图像窗口

二、物体识别

　　0.图像识别与定位：

　　　　(1)Classification:C个类别

　　　　(2)Input:Image

　　　　(3)Output:类别标签

　　　　(4)Evaluation metric:准确率

　　1.Localization:

　　　　(1)Input:Image

　　　　(2)Output:物体边界框(x,y,w,h)

　　　　(3)Evaluation metric:交并准则IOU

　　2.Classification+Localization:识别主体+定位(四元组完成)

　　3.边缘策略/选择性搜索=》R-CNN

　　4.R-CNN=>Fast R-CNN

　　5.Fast R-CNN=>Fast R-CNN

　　6.YOLO/SSD

　　7.ImageNet:(1)实际上有识别+定位 2个任务

　　　　(1)思路1：看做回归问题

　　　　　　　　最后的卷积层后

　　　　　　　　全连接层后

　　　　(2)能否对主题有更细致的识别？

　　　　　　　　提前规定好有K个组成部分

　　　　　　　　做成K个部分(关节)做回归预测=》收尾相接的线段

　　　　(3)思路2:图窗+识别与整合

　　　　　　类似刚才的classification+regression思路

　　　　　　选取不同的大小的框

　　　　　　让框出现在不同的位置上

　　　　　　判定得分

　　　　　　按照得分高低对“结果框”做抽取和合并

　　　　(4)实际应用的时候，会尝试各种大小的窗口，甚至在窗口上做一些回归的事情

　　　　(5)想办法克服一下过程中的“参数多”与“计算慢”

　　　　　　用多卷积核的卷积层替换全连接层

　　　　　　降低参数量

　　　　(6)测试/识别阶段的计算是可以复用的(小卷积)

　　　　　加速计算

三、图像分割

　　1.语义分割

　　2.反卷积

CNN与图像高级应用的更多相关文章

使用CNN生成图像先验，实现更广泛场景的盲图像去模糊
现有的最优方法在文本.人脸以及低光照图像上的盲图像去模糊效果并不佳,主要受限于图像先验的手工设计属性.本文研究者将图像先验表示为二值分类器,训练 CNN 来分类模糊和清晰图像.实验表明,该图像先验比目 ...
CSS 图像高级 Css Sprites
上节课中我们学习了背景图像,这节课我们学习背景图像的高级知识,如Css Sprites,CSS 背景渐变等. Css Sprites Css Sprites,国内也叫CSS精灵.它的原理是将许多的小图 ...
卷积神经网络(CNN)张量(图像)的尺寸和参数计算(深度学习)
分享一些公式计算张量(图像)的尺寸,以及卷积神经网络(CNN)中层参数的计算. 以AlexNet网络为例,以下是该网络的参数结构图. AlexNet网络的层结构如下: 1.Input: 图 ...
CNN与图像应用
一.图像识别与定位 0.Classification:C个类别 Input:Image Output:类别标签 Evaluation metric:准确率 1.Localization: Input: ...
CSS 图像高级径向渐变
径向渐变径向渐变使用 radial-gradient 函数语法. 这个语法和线性渐变很类似, 可以指定渐变结束时的形状以及它的大小. 默认来说,结束形状是一个椭圆形并且和容器的大小比例保持一致. ...
CSS 图像高级 CSS 渐变
CSS 渐变 CSS 渐变是在 CSS3 Image Module 中新增加的 <image> 类型. 使用 CSS 渐变可以在两种颜色间制造出平滑的渐变效果.用渐变代替图片,可以加快页面 ...
使用CNN做电影评论的负面检测——本质上感觉和ngram或者LSTM同，因为CNN里图像检测卷积一般是3x3，而文本分类的话是直接是一维的3、4、5
代码如下: from __future__ import division, print_function, absolute_import import tensorflow as tf impor ...
原来CNN是这样提取图像特征的。。。
对于即将到来的人工智能时代,作为一个有理想有追求的程序员,不懂深度学习(Deep Learning)这个超热的领域,会不会感觉马上就out了?作为机器学习的一个分支,深度学习同样需要计算机获得强大的学 ...
visualization of filters keras 基于Keras的卷积神经网络（CNN）可视化
https://adeshpande3.github.io/adeshpande3.github.io/ https://blog.csdn.net/weiwei9363/article/detail ...

随机推荐

Linux-expect脚本-1
expect是基于tcl演变而来的,所以很多语法和tcl类似,基本的语法如下所示: 首行加上/usr/bin/expect spawn: 后面加上需要执行的shell命令,比如说spawn sudo ...
微信小程序 — 速学速查笔记
1. 配置配置全解析 project.config.json ( 项目配置文件 ) { // 文件描述 "description": "项目配置文件", // ...
MQTT QOS含义
特别提示:本人博客部分有参考网络其他博客,但均是本人亲手编写过并验证通过.如发现博客有错误,请及时提出以免误导其他人,谢谢!欢迎转载,但记得标明文章出处:http://www.cnblogs.com/ ...
Mybaits 运行原理流程图
leetcode 41缺失的第一个正数
time O(n) space O(1) class Solution { public: int firstMissingPositive(vector<int>& nums) ...
自定义View饼状图的绘制
package com.loaderman.customviewdemo; import android.content.Context; import android.graphics.Canvas ...
阶段3 3.SpringMVC·_01.SpringMVC概述及入门案例_04.入门程序之搭建开发环境
选择骨架构建默认选中next-然后finish后就会去网上下载插件.会比较耗费时间. 添加一组键值对: archetypeCatalog internal 添加了这组坚持对,就可以解决Mavn项目创 ...
ASP.NET MVC 开发随笔（二）
1.目前在局部视图中使用多个model时候,发现使用IEnumerable的时候,读取不了原来model的内容,所以采用List发现没问题 2．如果想在JS中使用Razor,则需要在Razor添加& ...
java：javaScript（定义方式，循环语句，函数与参数，事件机制，控制台记录，event事件获取键盘ascii，confirm和prompt，事件和内置对象，获取input，点击更换背景色）
1. 定义JS的两种方式: <!DOCTYPE> <html> <head> <meta charset="UTF-8"></ ...
windows命令行查看&生成项目树
项目写好以后,想要查看项目结构或生成结构树便于后面查看,可以: 1.进入项目所在目录 2.输入tree,回车后显示项目 3.在项目根目录下保存生成的结构树输入tree > list.txt命令