Weilin Huang——[arXiv2016]Accurate Text Localization in Natural Image with Cascaded Convolutional Text Network 目录 作者和相关链接 背景介绍 方法概括 方法细节 实验结果 总结与收获点 参考文献 作者和相关链接 个人主页:Tong He,黄伟林,乔宇,姚剑 作者简单信息: 论文下载:论文传送门 背景介绍 自底向上方法(bottom up)的一般流程 Step 1: 用滑动窗口或者MSER…
最近ISSCC2017大会刚刚举行,看了关于Deep Learning处理器的Session 14,有一些不错的东西,在这里记录一下. A 2.9TOPS/W Deep Convolutional Neural Network SoC in FD-SOI 28nm for Intelligent Embedded Systems 单位:STMicroelectronics(意法半导体) 这是一篇很综合芯片SOC设计,总体架构如下: 本文采用的DSP簇作为加速阵列,包含8个DSP簇,每簇内含2个3…
最近ISSCC2017大会刚刚举行,看了关于Deep Learning处理器的Session 14,有一些不错的东西,在这里记录一下. A 2.9TOPS/W Deep Convolutional Neural Network SoC in FD-SOI 28nm for Intelligent Embedded Systems 单位:STMicroelectronics(意法半导体) 这是一篇很综合芯片SOC设计,总体架构如下: 本文采用的DSP簇作为加速阵列,包含8个DSP簇,每簇内含2个3…
进行文本的检测的学习,开始使用的是ctpn网络,由于ctpn只能检测水平的文字,而对场景图片中倾斜的文本无法进行很好的检测,故将网络换为RRCNN(全称如题).小白一枚,这里就将RRCNN的论文拿来拜读一下,也记录一下自己阅读过程中的收获. 原英文论文网址:https://arxiv.org/abs/1706.09579 在这篇论文中,作者提出了Rotational Region CNN(旋转区域CNN?),据作者说可以检测场景图片中任意角度的文本.这个网络是在Faster R-CNN的基础上搭…
简介 ORB-SLAM3是第一个能在单目.双目.RGBD鱼眼相机和针孔相机模型下运行视觉.视觉-惯导以及多地图SLAM的系统.其贡献主要包括两方面:提出了完全依赖于最大后验估计的紧耦合视觉-惯导SLAM系统,IMU初始化阶段也采用最大后验估计.可以在室内室外大小各种环境下运行,比其他算法快2-5倍.其次提出了多地图系统,DBoW2用于回环检测需要保证时间一致性,在验证几何一致性前需要匹配三个连续的关键帧到同一区域,虽然精度高,但是召回率低,因而回环检测过程太慢,之前的地图很难重复利用到.ORB-…
论文源址:https://arxiv.org/abs/1605.06409 开源代码:https://github.com/PureDiors/pytorch_RFCN 摘要 提出了基于区域的全卷积网络,用于精确高效的目标检测,相比于基于区域的检测器(Fast/Faster R-CNN),这些检测器重复的在子区域进行数百次计算,而本文在整张图像上进行共享计算.因此,本文提出了基于位置敏感分数图用于解决图像分类中的平移不变性及目标检测中的平移可变性之间的矛盾.将图像分类网络处理为全卷积网络用于目标…
论文源址:https://arxiv.org/abs/1709.04609 摘要 该文提出了基于深度学习的实例分割框架,主要分为三步,(1)训练一个基于ResNet-101的通用模型,用于分割图像中的前景和背景.(2)将通用模型进行微调成为一个实例分割模型,借助于视频第一帧的标签文件对不同个体进行实例分割.同时,从实例分割模型中得到每一个物体的像素级score map.每张score map代表物体类别的概率,并且只和视频第一帧的ground truth 计算.(3)提出空间传播网络用于增强前面…
Weilin Huang--[AAAI2016]Reading Scene Text in Deep Convolutional Sequences 目录 作者和相关链接 方法概括 创新点和贡献 方法细节 实验结果 问题讨论 总结与收获点 参考文献 作者和相关链接 论文下载 黄伟林主页 , 乔宇,汤晓欧 所有作者 方法概括 解决问题:单词识别 主要流程:maxout版的CNN提取特征,RNN(LSTM)进行分类,CTC对结果进行调整.整个流程端到端训练和测试,和白翔的CRNN(参考文献1)方法几…
Weilin Huang--[TIP2015]Text-Attentional Convolutional Neural Network for Scene Text Detection) 目录 作者和相关链接 方法概括 创新点和贡献 方法细节 实验结果 问题讨论 总结与收获点 作者补充信息 参考文献 作者和相关链接 论文下载 作者: tong he, 黄伟林,乔宇,姚剑 方法概括 使用改进版的MSER(CE-MSERs,contrast-enhancement)提取候选字符区域: 使用新的CN…
Weilin Huang——[ECCV2016]Detecting Text in Natural Image with Connectionist Text Proposal Network 目录 作者和相关链接 几个关键的Idea出发点 方法概括 方法细节 实验结果 总结与收获点 作者和相关链接 个人主页:Zhi Tian,黄伟林,Tong He,Pan He,乔宇 作者简单信息: 论文下载:论文传送门 代码下载:代码传送门 几个关键的Idea出发点 文本检测和一般目标检测的不同——文本线是…