一.整体网络结构              二.细节                                      n=7,(7+7)*2+4=32个channel 三.结果              四.总结        1.不做连线的话只能水平方向 2.连线可以多方向,但可能是扭曲的不规则形状 3.两阶段的回归,提高准确率 五.问题       1.回归的扭曲的多边形形状怎么算的f值???…
目录 XiangBai--[PAMI2018]ASTER_An Attentional Scene Text Recognizer with Flexible Rectification 作者和论文 方法概述 1. 主要思路 2. 方法框架和流程 3. 文章亮点 方法细节 1. 背景 2. Rectification Network 3. Recognition Network 4. 网络训练 实验结果 总结与收获 参考文献 XiangBai--[PAMI2018]ASTER_An Attent…
Weilin Huang--[AAAI2016]Reading Scene Text in Deep Convolutional Sequences 目录 作者和相关链接 方法概括 创新点和贡献 方法细节 实验结果 问题讨论 总结与收获点 参考文献 作者和相关链接 论文下载 黄伟林主页 , 乔宇,汤晓欧 所有作者 方法概括 解决问题:单词识别 主要流程:maxout版的CNN提取特征,RNN(LSTM)进行分类,CTC对结果进行调整.整个流程端到端训练和测试,和白翔的CRNN(参考文献1)方法几…
Lukas Neuman--[ICDAR2015]Efficient Scene Text Localization and Recognition with Local Character Refinement 算法介绍 Fig. 2. Overview of the method. Initial text hypotheses efficiently generatedby a MSER detector are further refined using a local text mod…
进行文本的检测的学习,开始使用的是ctpn网络,由于ctpn只能检测水平的文字,而对场景图片中倾斜的文本无法进行很好的检测,故将网络换为RRCNN(全称如题).小白一枚,这里就将RRCNN的论文拿来拜读一下,也记录一下自己阅读过程中的收获. 原英文论文网址:https://arxiv.org/abs/1706.09579 在这篇论文中,作者提出了Rotational Region CNN(旋转区域CNN?),据作者说可以检测场景图片中任意角度的文本.这个网络是在Faster R-CNN的基础上搭…
Weilin Huang--[TIP2015]Text-Attentional Convolutional Neural Network for Scene Text Detection) 目录 作者和相关链接 方法概括 创新点和贡献 方法细节 实验结果 问题讨论 总结与收获点 作者补充信息 参考文献 作者和相关链接 论文下载 作者: tong he, 黄伟林,乔宇,姚剑 方法概括 使用改进版的MSER(CE-MSERs,contrast-enhancement)提取候选字符区域: 使用新的CN…
Chuhui Xue--[arxiv2019]MSR_Multi-Scale Shape Regression for Scene Text Detection 论文 Chuhui Xue--[arxiv2019]MSR_Multi-Scale Shape Regression for Scene Text Detection 作者 Chuhui Xue, Shijian Lu, Wei Zhang 亮点 multi-scale网络中利用FPN的up-sampling把多个不同scale得到的结…
Xiang Bai--[arXiv2016]Scene Text Detection via Holistic, Multi-Channel Prediction 目录 作者和相关链接 方法概括 创新点和贡献 方法细节 实验结果 问题讨论 总结与收获点 参考文献 作者和相关链接 作者 白翔个人主页 论文下载 方法概括  Step 1: 用修改版的hed(参考文献1)得到text region map(binary), character map(binary), linking orientat…
XiangBai_CVPR2018_Rotation-Sensitive Regression for Oriented Scene Text Detection 作者和代码 caffe代码 关键词 文字检测.多方向.SSD.$$xywh\theta$$.one-stage,开源 方法亮点 核心思想认为,分类问题对于旋转不敏感,但回归问题对于旋转是敏感的,因此两个任务不应该用同样的特征.所以作者提出来基于旋转CNN的思路,先对特征做不同角度的旋转,该特征用于做框的回归,而对分类问题,采用沿ori…
Chuhui Xue_ECCV2018_Accurate Scene Text Detection through Border Semantics Awareness and Bootstrapping 作者和代码 关键词 文字检测.多方向.FCN.$$xywh\theta$$.multi-stage.border 方法亮点 采用Bootstrapping进行数据扩增 增加border-loss 方法概述 本文方法是直接回归的方法,除了学习text/non-text分类任务,四个点到边界的回归…