Pan He_ICCV2017_Single Shot Text Detector With Regional Attention 作者和代码 caffe代码 关键词 文字检测.多方向.SSD.$$xywh\theta$$ .one-stage.开源 方法亮点 Attention机制强化文字特征: Text Attentional Module 引入Inception来增强detector对文字大小的鲁棒性:Hierarchical Inception Module(HIM) 方法概述 本文方法…
方法概述 该方法用一个端到端网络完成文字检测整个过程——除了基础卷积网络(backbone)外,包括两个并行分支和一个后处理.第一个分支是通过一个DSSD网络进行角点检测来提取候选文字区域,第二个分支是利用类似于RFCN进行网格划分的方式来做position-sensitive的segmentation.后处理是利用segmentation的score map的综合得分,过滤角点检测得到的候选区域中的噪声. 文章亮点: (1)不是用一般的目标检测的框架,而是用角点检测(corner point…
XiangBai_TIP2018_TextBoxes++_A Single-Shot Oriented Scene Text Detector 作者和代码 Minghui Liao, Baoguang Shi, Xiang Bai, Senior Member, IEEE caffe检测torch7识别代码 关键词 文字检测.多方向.SSD.四个点.one-stage.开源 方法亮点 把原本只能做水平的TextBoxes改为可以预测任意四边形的多方向文本检测 除了常规的分类.回归损失,还增加了四…
Sheng Zhang_AAAI2018_Feature Enhancement Network_A Refined Scene Text Detector 作者 关键词 文字检测.水平文字.Faster- RCNN.xywh.multi-stage 方法亮点 Feature Enhancement RPN (FE-RPN) :在原来的RPN基础上增加了两个卷积分支来增强文字特征的鲁棒性,一个分支通过增加长条形卷积核来提高对长条形文字的检测能力, 另一个分支利用增加池化和上采样层等方式来扩大感受…
Jiaming Liu--[2019]Detecting Text in the Wild with Deep Character Embedding Network 论文 Jiaming Liu--[2019]Detecting Text in the Wild with Deep Character Embedding Network 作者 亮点 通过将文字的字符合并问题转成字符embedding问题,利用一个网络来学习字符间的连接关系 方法概述 针对任意文字检测(水平.倾斜.曲文),采用从…
Chuhui Xue--[arxiv2019]MSR_Multi-Scale Shape Regression for Scene Text Detection 论文 Chuhui Xue--[arxiv2019]MSR_Multi-Scale Shape Regression for Scene Text Detection 作者 Chuhui Xue, Shijian Lu, Wei Zhang 亮点 multi-scale网络中利用FPN的up-sampling把多个不同scale得到的结…
Yongchao Xu--[2018]TextField_Learning A Deep Direction Field for Irregular Scene Text Detection 论文 Yongchao Xu--[2018]TextField_Learning A Deep Direction Field for Irregular Scene Text Detection 作者 亮点 提出的TextField方法非常新颖,用点到最近boundary点的向量来区分不同instance…
Han Hu--[ICCV2017]WordSup_Exploiting Word Annotations for Character based Text Detection 作者和代码 caffe检测torch7识别代码 关键词 文字检测.多方向.直接回归.$$xywh\theta$$ .multi-stage.监督学习 方法亮点 采用单词.文本行的标注信息进行监督学习来辅助字符检测 在ICDAR2013数据集上F值90+,后来的方法能超过这篇文章的寥寥无几 方法概述 利用Faster RC…
Yuliang Liu_2017_Detecting Curve Text in the Wild_New Dataset and New Solution 作者和代码 caffe版代码 关键词 文字检测.曲文.直接回归.14个点.one-stage.开源 方法亮点 第一篇做曲文检测,还提出一个数据集CTW1500 使用14个点多边形来表示曲文 提出了一个结合CNN-RPN+RNN的检测方法专门做曲文检测 方法概述 本文方法基于RPN进行修改,除了学习text/non-text分类,多边形的bo…
XiangBai_CVPR2018_Rotation-Sensitive Regression for Oriented Scene Text Detection 作者和代码 caffe代码 关键词 文字检测.多方向.SSD.$$xywh\theta$$.one-stage,开源 方法亮点 核心思想认为,分类问题对于旋转不敏感,但回归问题对于旋转是敏感的,因此两个任务不应该用同样的特征.所以作者提出来基于旋转CNN的思路,先对特征做不同角度的旋转,该特征用于做框的回归,而对分类问题,采用沿ori…
Shitala Prasad_ECCV2018]Using Object Information for Spotting Text 作者和代码 关键词 文字检测.水平文本.FasterRCNN.xywh.multi-stage 方法亮点 作者argue图像中的文字不可能单独出现,文字一定是写在什么载体上的,比如衣服,包装袋,交通部标志牌,黑板上,而且文字不会出现在某些载体上,比如天空,水面上,也就是说文字背后的载体对文字是否出现也有很强的相关性和指导性.所以,他串联了两个网络,第一个用来做通用…
Shangbang Long_ECCV2018_TextSnake_A Flexible Representation for Detecting Text of Arbitrary Shapes 作者 关键词 文字检测,曲线文本,多方向,multi-stage,圆盘表示法 方法亮点 提出一个新的曲线文本表示方法TextSnake(由圆盘序列组成) 提出了一个新的曲文检测方法,并且精度比之前的高40%+(Total-Text数据集) 方法概述 本文方法基于一个新的曲线文本表示方法TextSnak…
Chuhui Xue_ECCV2018_Accurate Scene Text Detection through Border Semantics Awareness and Bootstrapping 作者和代码 关键词 文字检测.多方向.FCN.$$xywh\theta$$.multi-stage.border 方法亮点 采用Bootstrapping进行数据扩增 增加border-loss 方法概述 本文方法是直接回归的方法,除了学习text/non-text分类任务,四个点到边界的回归…
Lianwen_Jin_CVPR2017_Deep_Matching_Prior_Network_Toward_Tighter_Multi-oriented_Text_Detection 作者 关键词 文字检测,多方向,SSD,四个点,one-stage 方法亮点 首先提出(并成功学习)用四个点的多边形来表示文字 用旋转anchor来解决倾斜文字检测问题 计算四边形的IOU方式(蒙特卡罗法) 方法概述 本文方法是对SSD(水平文字检测)进行改进,通过学习四个点相对多方向anchor的位置信息,用…
Dan Deng--[AAAI2018]PixelLink_Detecting Scene Text via Instance Segmentation 作者和代码 tensorflow代码 关键词 文字检测.多方向.直接回归.$$xywh\theta$$.one-stage.开源 方法亮点 使用instance segmentation的思路做(利用了二类分类+每个像素点与周围8个顶点的link分类) 利用图像处理方法进行后处理,不需要用NMS 方法概述 本文方法采用instance segm…
Cong_Yao_CVPR2017_EAST_An_Efficient_and_Accurate_Scene_Text_Detector 作者和代码 非官方版tensorflow实现 非官方版keras实现 支持长文本检测的keras改进版实现 方法流程 该方法利用多层卷积神经网络提取图像特征,再利用该特征分别进行两个任务,像素点的分类,以及对应像素点的框的回归.最后将两个任务结果结合起来,并用非极大值抑制NMS来得到最终检测结果. GroundTruth生成 点的分类任务,实际上是一个图像分割…
ChengLin Liu_ICCV2017_Deep Direct Regression for Multi-Oriented Scene Text Detection 作者 关键词 文字检测.多方向.直接回归.4个点.one-stage 方法亮点 第一次提出Direct Regression这个概念 提出用Scale & shift方案来降低坐标位置学习的难度 方法概述 本文方法首次提出直接回归的概念,用自己搭建的FPN网络结构,直接学习四个点相对于中心点(feature map上的某个点)的…
论文标题:SSD: Single Shot MultiBox Detector 论文作者:Wei Liu, Dragomir Anguelov, Dumitru Erhan, Christian Szegedy, Scott Reed, Cheng-Yang Fu,Alexander C. Berg 论文地址:https://arxiv.org/abs/1512.02325 SSD 的GitHub地址:https://github.com/balancap/SSD-Tensorflow 参考的S…
这几天读了SSD论文的原理部分,看了别人的翻译,发现很多应该都是google直接翻译过来的,有些地方读的不是很通顺,自己就在自己的理解和搜索的基础上对我看的那篇翻译做了一些修改.[原文地址:http://noahsnail.com/2017/12/11/2017-12-11-Single%20Shot%20MultiBox%20Detector%E8%AE%BA%E6%96%87%E7%BF%BB%E8%AF%91%E2%80%94%E2%80%94%E4%B8%AD%E8%8B%B1%E6%9…
XiangBai——[AAAI2017]TextBoxes:A Fast Text Detector with a Single Deep Neural Network 目录 作者和相关链接 方法概括 创新点和贡献 方法细节 实验结果 总结与收获点 作者和相关链接 作者 论文下载 廖明辉,石葆光, 白翔, 王兴刚 ,刘文予 代码下载 方法概括 文章核心: 改进版的SSD用来解决文字检测问题 端到端识别的pipeline: Step 1: 图像输入到修改版SSD网络中 + 非极大值抑制(NMS)→…
转载自:https://zhuanlan.zhihu.com/p/33544892 前言 目标检测近年来已经取得了很重要的进展,主流的算法主要分为两个类型(参考RefineDet):(1)two-stage方法,如R-CNN系算法,其主要思路是先通过启发式方法(selective search)或者CNN网络(RPN)产生一系列稀疏的候选框,然后对这些候选框进行分类与回归,two-stage方法的优势是准确度高:(2)one-stage方法,如Yolo和SSD,其主要思路是均匀地在图片的不同位置…
SSD:Single Shot MultiBox Detector Intro SSD是一套one-stage算法实现目标检测的框架,速度很快,在当时速度超过了yolo,精度也可以达到two-stage的精度,可以与faster rcnn媲美,这套算法里用到了与faster rcnn的anchor相似的概念-default box,也解决了多尺度问题对one-stage的影响-对不同大小的feature map进行滑窗分类,使得不同尺度的feature map的分类器对原图目标尺度更加敏感. o…
XiangBai--[AAAI2017]TextBoxes:A Fast Text Detector with a Single Deep Neural Network 目录 作者和相关链接 方法概括 创新点和贡献 方法细节 实验结果 总结与收获点 作者和相关链接 作者 论文下载 廖明辉,石葆光, 白翔, 王兴刚 ,刘文予 代码下载 方法概括 文章核心: 改进版的SSD用来解决文字检测问题 端到端识别的pipeline: Step 1: 图像输入到修改版SSD网络中 + 非极大值抑制(NMS)→…
下文图文介绍转自watersink的博文SSD(Single Shot MultiBox Detector)不得不说的那些事. 该方法出自2016年的一篇ECCV的oral paper,SSD: Single Shot MultiBoxDetector,算是一个革命性的方法了,非常值得学习和研究. 论文解析: SSD的特殊之处主要体现在以下3点: (1)多尺度的特征图检测(Multi-scale),如SSD同时使用了上图所示的8*8的特征图和4*4特征图. (2)相比于YOLO,作者使用的是卷积…
By Wei Liu, Dragomir Anguelov, Dumitru Erhan, Christian Szegedy, Scott Reed, Cheng-Yang Fu, Alexander C. Berg. Introduction SSD is an unified framework for object detection with a single network. You can use the code to train/evaluate a network for o…
SSD,全称Single Shot MultiBox Detector,是Wei Liu在ECCV 2016上提出的一种目标检测算法,截至目前是主要的检测框架之一,相比Faster RCNN有明显的速度优势,相比YOLO又有明显的mAP优势(不过已经被CVPR 2017的YOLO9000超越) 在VOC2007上,SSD300比Faster R-CNN的mAP高了6.6倍 在VOC2007上,SSD300比YOLP的FPS高了10%倍 1.SSD网络结构 SSD网络最前边使用了VGG16的前5个…
今天介绍目标检测中非常著名的一个框架 SSD,与之前的 R-CNN 系列的不同,而且速度比 YOLO 更快. SSD 的核心思想是将不同尺度的 feature map 分成很多固定大小的 box,然后对每个 box 做预测,既要预测该 box 所包含的 object 属于哪一类,也要预测该 box 与真实的 box 之间的偏差. 为了获得更高的检测精度,SSD 利用了多尺度的技巧,既利用了不同尺度的 feature map,也利用了不同尺度的 box,还利用了不同的比率. 论文也给出了说明图,对…
SSD: Single Shot MultiBox Detector 作者: Wei Liu, Dragomir Anguelov, Dumitru Erhan, Christian Szegedy, Scott Reed, Cheng-Yang Fu, Alexander C. Berg 引用: Liu, Wei, et al. "SSD: Single Shot MultiBox Detector." arXiv preprint arXiv:1512.02325 (2015).…
转自:AI之路 这篇博客主要介绍SSD算法,该算法是最近一年比较优秀的object detection算法,主要特点在于采用了特征融合. 论文:SSD single shot multibox detector论文链接:https://arxiv.org/abs/1512.02325 算法概述: 本文提出的SSD算法是一种直接预测bounding box的坐标和类别的object detection算法,没有生成proposal的过程.针对不同大小的物体检测,传统的做法是将图像转换成不同的大小,…
本文转载自: http://www.cnblogs.com/lillylin/p/6207292.html SSD论文阅读(Wei Liu--[ECCV2016]SSD Single Shot MultiBox Detector) 目录 作者及相关链接 文章的选择原因 方法概括 方法细节 相关背景补充 实验结果 与相关文章的对比 总结 作者 intro: ECCV 2016 Oral arxiv: http://arxiv.org/abs/1512.02325 paper: http://www…