厉害了!阿里安全图灵实验室在ICDAR2017 MLT竞赛刷新世界最好成绩
近日,阿里安全图灵实验室(Alibaba Turing Lab)的ATL Cangjie OCR算法在ICDAR2017的MLT(Competition on Multi-lingual scene text detection)自然场景多语言文本检测竞赛中刷新了世界最好成绩,以73.52%的Hmean排名第一。(竞赛结果页面:http://rrc.cvc.uab.es/?ch=8&com=evaluation&task=1)
据了解,ICDAR(International Conference on Document Analysis and Recognition)具有OCR领域的奥斯卡盛会之称,是全球OCR领域公认最权威的比赛之一。
当前,OCR技术被广泛应用于多个领域。从名片、发票、银行卡等票据的数字化到室外街道商店索引,路标路牌识别;再到图片、视频文字内容理解与内容安全,OCR技术都发挥着越来越重要的作用。
阿里安全图灵实验室研究人员称,在技术上,文本检测和识别需要应付各种考验和挑战,如自然场景下光照的影响,物体的遮挡,文字大小、比例、角度的变化,图像视频中文字的模糊等等。ICDAR2017 MLT竞赛包含了中、日、韩、拉丁(英、法、德、意)、阿拉伯和孟加拉等9种语言,其图像采集自各种各样的场景,其中的文本的长度、字体、尺寸、颜色千变万化,同时还包含了许多真实场景的噪声包括光照、遮挡、倾斜、文字堆叠、文字镶嵌、透视变化等等,这对于OCR算法的适应能力更具挑战性。
为攻克这些难题,阿里安全图灵实验室的研究人员设计了基于深度学习的网络模型和算法。
据介绍,图灵实验室的研究人员在文字检测模型方面,采用深度卷积神经网络获得更深层的图像特征;并利用多尺度特征和非对称卷积核获得更好的感受视野,从而适应各种环境,各种大小、比例、角度的文字。此外,由于框架采用创新性的检测策略,因此相较于传统的RCNN-based方案,在检测速度上有很大提升。在文字识别模型,图灵实验室的研究人员在主流方案的基础上,做了全新的探索和研究,从而获得了更为有效的识别模型,在保证识别准确率的前提下,提高了识别效率。
阿里安全图灵实验室研究人员表示,ATL Cangjie OCR提供在线同步、异步通用OCR文字检测和识别服务,以及离线ODPS服务,为图片文字内容理解与内容安全提供强有力的技术支撑。该模型已经全面支撑阿里生态中的商品内容安全、业务安全、平台治理、评价、交互、认证等多个业务场景,同时,还通过阿里云盾-内容安全(绿网)产品,输出给第三方客户使用。
目前,ATL Cangjie OCR服务日均调用量几亿次,可为客户提供稳定的技术保障。(作者:华蒙)
厉害了!阿里安全图灵实验室在ICDAR2017 MLT竞赛刷新世界最好成绩的更多相关文章
- 阿里安全归零实验室招聘各路大牛!offer好说!
阿里安全归零实验室成立于2017年11月,致力于对黑灰产技术的研究.实验室的愿景是通过技术手段解决当前日益严重的网络违规和网络犯罪问题,为阿里新经济体保驾护航. 实验室与寄生在阿里生态经济体的黑灰产直 ...
- 阿里云体验实验室 教你如何《快速搭建LNMP环境》
## 体验平台简介 面向开发者和中小企业打造的一站式.全云端的开发平台,打开浏览器就可以开发.调试.上线,所测即所得,并结合无服务器的模式,重新定义云原生时代的研发工作方法论.旨在降低开发者上手成本和 ...
- 阿里云体验实验室 教你《搭建Hadoop环境》
体验平台简介 面向开发者和中小企业打造的一站式.全云端的开发平台,打开浏览器就可以开发.调试.上线,所测即所得,并结合无服务器的模式,重新定义云原生时代的研发工作方法论.旨在降低开发者上手成本和中小企 ...
- 阿里云体验实验室 体验教程《Linux指令入门-系统管理》
体验平台简介 阿里云开发者实验室提供免费云资源和丰富的场景化实践,旨在帮助开发者在学习应用技术,了解阿里云产品的特性. 阿里云体验实验室地址:https://developer.aliyun.com/ ...
- 技术解密 |阿里云多媒体 AI 团队拿下 CVPR2021 5 冠 1 亚成绩的技术分享
6 月 19-25 日,备受全球瞩目的国际顶级视觉会议 CVPR2021(Computer Vision and Pattern Recognition,即国际机器视觉与模式识别)在线上举行,但依然人 ...
- 阿里聚安全·安全周刊】一种秘密窃取数据的新型 Android 木马|iOS 11相机惊现BUG
本周的七个关键词: 新型 Android 木马丨 TLS 1.3 丨 阿里安全图灵实验室 丨 漏洞感染 Linux 服务器 丨 CPU曝极危漏洞 丨 iOS 11相机BUG 丨R2D2技术 - ...
- RSAC 2018:人工智能成为驱动网络安全的新 “引擎”
作为全球顶级的权威安全会议,RSA已成为快速了解世界安全趋势的风向标,更是影响安全产业转型与持续发展的重要平台.不同于往年人工智能(AI)在安全领域更多的是一种理论探讨,今年看到的是大量人工智能在安全 ...
- 专访TK教主于旸:原来那些搞安全的说的都是真的(图灵访谈)
引用:http://www.ituring.com.cn/article/196609 于旸,网名“tombkeeper”,在国内黑客界被尊称为“TK教主”,现任腾讯玄武实验室总监.于旸从事信息安全研 ...
- 阿里云DMS发布数据库网关服务: 打通网络限制 开启数据库统一管理的万能钥匙
概述 阿里云数据管理DMS在云端可提供专业的数据库服务,除对标本地数据库软件的基础功能外,还包含性能诊断.数据追踪.跨实例SQL查询(含异构数据库类型之间)等专业性功能,同时提供审计安全和企业级数据库 ...
随机推荐
- mac攻略(2) -- apache站点配置
[http://www.cnblogs.com/redirect/p/6112164.html] Mac OS X 中默认有两个目录可以直接运行你的 Web 程序, 一个是系统级的 Web 根目录:/ ...
- CentOS时间的查看与修改
[http://www.centoscn.com/CentOS/help/2014/0805/3430.html] 1.查看.修改Linux时区与时间 一.linux时区的查看与修改 1,查看当前时区 ...
- openwrt pptpd客户端
步骤 opkg update opkg install ppp-mod-pptp opkg install luci-proto-ppp 在OpenWRT安裝PPTP Client端 首先用ssh登陆 ...
- Ubuntu 配置FTP服务器
第三方的文件传输软件用着很不爽,想着自己搭建一个FTP来干活. 首先检查是否已经安装了FTP,输入命令: vsftpd -v 可以查看版本,如果没有安装,无法执行. 安装FTP p.p1 { mar ...
- 简单http文件服务器
日常工作中,主要是通过ssh终端(putty等)远程开发,经常涉及到传输文件,因为本地系统为Win10,所以没办法利用强大的linux脚本来进行文件传输.之前用过python的SimpleHttp模块 ...
- 2018/3/2晚11点30分写的程序(C++)
程序目标:输入一个字符串,竖向输出该字符串.使用string和动态分配内存机制.代码如下: #include<iostream>#include "stdafx.h"# ...
- 1.9 list 列表
列表是什么? list是Python中的基本数据结构之一,属于可变序列,所以前文中讲的可变序列的通用操作都适用于list. 这一节讲列表的特性吧. 特性一: 列表是包含任意对象的有序集合,同一个列表中 ...
- uva225 回溯剪枝
这道题要剪枝,不然会超时,还有就是每次参加过的城市下次不能再参观,不然会WA. 对于障碍物的坐标我用了两种方法,第一种就是直接用STL里面的set,对于判断是否访问过直接用的count,用时960ms ...
- Zookeeper笔记3——原理及其安装使用
Zookeeper到底能干什么? 1.配置管理:这个好理解.分布式系统都有好多机器,Zookeeper提供了这样的一种服务:一种集中管理配置的方法,我们在这个集中的地方修改了配置,所有对这个配置感兴趣 ...
- Luogu P1757 通天之分组背包
题目背景 直达通天路·小A历险记第二篇 题目描述 自01背包问世之后,小A对此深感兴趣.一天,小A去远游,却发现他的背包不同于01背包,他的物品大致可分为k组,每组中的物品相互冲突,现在,他想知道最大 ...