CNN与图像应用

stone1234567890 2024-10-20 09:26:22 原文

一、图像识别与定位

　　0.Classification:C个类别

　　　Input:Image

　　　Output:类别标签

　　　Evaluation metric:准确率

　　1.Localization:

　　　　Input:Image

　　　　Output:物体边界框(xy,w,h)

　　　　Evaluation mertric:交并准则

　　3.Classification+Localization:识别主题+定位

　 4.ImageNet：实际上有识别+定位 2个任务

　　5.思路1：视作回归问题

　　　　(1)先解决简单问题，搭建一个识别图像的神经网络

　　　　(2)在AlexNet VGG GoogleLenet ResNet上fine-tun一下

　　　　(3)步骤2：在上述神经网络的尾部展开，称为classification+regresssion模式

　　　　(4)步骤3：回归部分(Regression)用欧氏距离损失；使用SGD(随机梯度下降)训练

　　　　

　　　　(5)Regression(回归)的模块部分加在什么位置

　　　　　　最后的卷积层后；全连接层后

　　　　(6)能否对主体有更细致的识别呢？

　　　　　　提前规定好友K个组成部分；做成K个部分的回归

　　　　(7)应用：如何识别人的姿势？

　　　　　　每个人的组成部分是固定的；对K个组成部分(关节)做回归预测=》收尾相连的线段

　　　　(8)实际应用时

　　　　　　尝试各种窗口的大小；甚至会在窗口上再做一些“回归”的事情

　　2.思路2：图窗+识别与整合

　　　　(0)想办法克服一下过程中的“参数多”与“计算慢”

　　　　　　测试/识别阶段的计算是可以复用的(小卷积)

　　　　　　加速计算

　　　　　　用多卷积核的卷积层替换全连接层

　　　　　　降低参数量

　　　　(1)类似刚才的classification+regression

　　　　(2)咱们取不同大小的“框”

　　　　(3)让框出现在不同的位置

　　　　(4)判定得分

　　　　(5)按照得分高低对结果框做抽取和合并　　　　

　　3.图像相关任务：

　　

二、物体识别

　　1.边缘策略/选择性搜索=>R-CNN

　　2.R-CNN=>Fast R-CNN

　　3.Fast R-CNN=>Faster R-CNN

　　4.YOLO/SSD

三、图像分割

　　1.语义分割

　　2.反卷积

CNN与图像应用的更多相关文章

使用CNN生成图像先验，实现更广泛场景的盲图像去模糊
现有的最优方法在文本.人脸以及低光照图像上的盲图像去模糊效果并不佳,主要受限于图像先验的手工设计属性.本文研究者将图像先验表示为二值分类器,训练 CNN 来分类模糊和清晰图像.实验表明,该图像先验比目 ...
卷积神经网络(CNN)张量(图像)的尺寸和参数计算(深度学习)
分享一些公式计算张量(图像)的尺寸,以及卷积神经网络(CNN)中层参数的计算. 以AlexNet网络为例,以下是该网络的参数结构图. AlexNet网络的层结构如下: 1.Input: 图 ...
CNN与图像高级应用
一.图像识别与定位思路1:视作回归 4个数字,用L2 loss/欧氏距离损失(x,y,w,h)这四个数都是连续值思路2:借助图像窗口二.物体识别 0.图像识别与定位: (1)Classifica ...
使用CNN做电影评论的负面检测——本质上感觉和ngram或者LSTM同，因为CNN里图像检测卷积一般是3x3，而文本分类的话是直接是一维的3、4、5
代码如下: from __future__ import division, print_function, absolute_import import tensorflow as tf impor ...
原来CNN是这样提取图像特征的。。。
对于即将到来的人工智能时代,作为一个有理想有追求的程序员,不懂深度学习(Deep Learning)这个超热的领域,会不会感觉马上就out了?作为机器学习的一个分支,深度学习同样需要计算机获得强大的学 ...
CNN 入门学习资料整理
建议按序阅读 1. Convolutional Neural Networks卷积神经网络: http://blog.csdn.net/zouxy09/article/details/8781543 ...
卷积神经网络CNN与深度学习常用框架的介绍与使用
一.神经网络为什么比传统的分类器好 1.传统的分类器有 LR(逻辑斯特回归) 或者 linear SVM ,多用来做线性分割,假如所有的样本可以看做一个个点,如下图,有蓝色的点和绿色的点,传统的分类器 ...
详解卷积神经网络（CNN）在语音识别中的应用
欢迎大家前往腾讯云社区,获取更多腾讯海量技术实践干货哦~ 作者:侯艺馨前言总结目前语音识别的发展现状,dnn.rnn/lstm和cnn算是语音识别中几个比较主流的方向.2012年,微软邓力和俞栋老 ...
NLP+VS=>Image Caption︱自动生成图像标题技术论文+相关项目
读聪明人的笔记,是不是也能变聪明呢? Image Caption是一个融合计算机视觉.自然语言处理和机器学习的综合问题,它类似于翻译一副图片为一段描述文字. Image Caption问题可以定义为二 ...

随机推荐

Alibaba DataX 源码编译
Alibaba DataX 源码编译标签(空格分隔): ETL DataX简介设计理念为了解决异构数据源同步问题,DataX将复杂的网状的同步链路变成了星型数据链路,DataX作为中间传输载体负 ...
Spring boot之JdbcTemplate
实体类 package com.kfit.demo1.bean; import javax.persistence.Entity; import javax.persistence.Generated ...
C++入门经典-例6.8-gets_s与puts的应用
1:使用标准输入函数cin和格式化输入函数scanf时都存在这样一个问题:当输入空格时,程序不会接受空格符之后的内容内容. 输入函数gets_s与输出函数puts都只以结束符'\0'作为输入\输出结束 ...
JAVA_OPT理解及调优理论
以RocketMQ的namesrv和broker启动为例,理解CMS和G1垃圾收集器下的jdk参数 CMS垃圾收集器以RocketMQ中runserver.cmd为例,这是启动NameSrv的命令行 ...
【CentOS】yum安装教训
前言:本来想安装sl在新安装的centos7上,网上搜了教程,很多都是先要你yum -y update,如下: 1.更新yum源: yum -y update 2.依赖安装: wget http:// ...
dnSpy
https://github.com/0xd4d/dnSpy 下载压缩包之后,解压,发现目录里面有3个exe文件需要用管理员运行dnSpy.exe,然后打开exe文件,设置好断点,然后start 使 ...
yconsole使用说明
介绍: yconsole是yhd用于管理缓存的工具(python实现),它的主要功能是为各个应用分配和管理缓存,以及错误修复.和它配合使用的还有ycache-client.yagent.zookeep ...
使用SNMP监控服务器运行情况
系统监测的基本概念及分类: a．系统监测的概述: 如何对现有IT架构的整体以及细节运行情况进行科学.系统和高效地监测是目前各企业运维和管理部门一项非常重要的工作内容.随着当前企业IT环境中服务器.应用 ...
java.net.BindException: Problem binding to [node2:45454] java.net.BindException: Cannot assign requested address
主要原因是网络的问题.可参考官方给出的详细解释. http://wiki.apache.org/hadoop/BindException 总之,这是网络或者配置网络的问题,跟 hadoop 基本没有关 ...
leetcode-easy-listnode-206 reverse linked list
mycode 98.87 # Definition for singly-linked list. # class ListNode(object): # def __init__(self, x ...