合合信息扫描全能王发布“黑科技”,让AI替人“思考”图像处理问题
现阶段,手机扫描正越来越多地进入到人们的生活中。随着扫描应用场景的不断拓宽,诸多细节的问题逐渐显露,比如使用者在拍照扫描文档时,手指不小心“入镜”了,只能重拍;拍电脑屏幕时,画面上有一些彩色条纹,既不美观也影响内容识别;拍完照片后发现文档很杂乱,扫描时需要手动叠加好几种图片处理方案,才能获得理想的效果……这些“糟心事”,如今被一个滤镜轻松解决了。
近期,合合信息旗下扫描全能王“智能高清滤镜”正式上线。该功能基于AI技术及智能扫描引擎,可自动检测图像中存在的问题并判定图像的优化方式,实现模糊、阴影、手指、屏幕纹等干扰因素一键全处理。使用者无需思考拍摄角度、光源、背景,只要点击单拍、多拍、扫描等任意拍摄按钮,便可得到一张如原稿打印般清晰、平整的图片。
扫描“一键到位”的背后,AI在帮人“思考”图像问题
与传统的手机扫描流程相比,扫描全能王“智能高清滤镜”的亮点之一,便是让AI代替人去“思考”图片中需要解决的问题,并为用户自动选择出最优处理方案,通过算法上的智能研判,达成多个问题一键解决的效果。
据合合信息扫描全能王事业部负责人曹超阳介绍,“智能高清滤镜”的智能研判主要基于精准的图像感知,来达成场景化的决策效果。在图像感知阶段,AI通过深度学习模型进行图像特征获取,感知到图像中的光照、阴影、颜色和倾斜角度等特征并对应进行图像处理,例如去除手指产生的遮挡、感知到图像是过暗还是过亮,然后针对性地调整图像的亮度和对比度等。

扫描全能王“智能高清滤镜”的去摩尔纹处理效果展示
场景化决策即根据图像感知的结果,判定图像属于何种场景,并进行个性化的处理。例如,试卷、发票的图像特点不尽相同,“智能高清滤镜”能够迅速判定文档种类并进行处理方法决策,在办公文档电子化、教育资料处理、商务资料留存等涉及文档处理的场景中具有广阔的应用前景。
智能扫描引擎,让AI读懂图像与文字
“智能高清滤镜”多项“黑科技”功能的实现,离不开智能扫描引擎AI-Scan(简称“AI-Scan引擎”)的支持。AI-Scan引擎基于合合信息智能文字识别、智能图像处理技术,对图像处理、文字识别及版面还原进行全面优化,综合提升扫描效果。
图像处理对于文档处理中所涉及的文字识别等后续流程非常关键,目前还存在着许多典型的痛点,最常见的就是“图像视觉矫正”。现实生活中,书本等文档并不总是平面的,AI在处理相关图片时需要进行“矫正”。此外,由于拍摄角度和镜头畸变的问题,即使是平面的文档,拍摄后也可能出现透视扭曲。扫描全能王采用了基于深度学习的曲面检测和矫正技术来进行处理,能够应对各种复杂的曲面文档。

扫描全能王“智能高清滤镜”书本曲面矫正处理效果展示
场景化决策即根据图像感知的结果,判定图像属于何种场景,并进行个性化的处理。例如,试卷、发票的图像特征不尽相同,“智能高清滤镜”能够迅速判定文档种类并进行处理方法决策,在办公文档电子化、教育资料处理、商务资料留存等涉及文档处理的场景中具有广阔的应用前景。

扫描全能王“智能高清滤镜”手指、阴影叠加处理效果展示
完成图像处理之后,如何从图片中正确提取所需信息,与文字识别能力息息相关。全球化进程的深化,让多语种识别成为一项高频需求,也为文字识别领域带来了巨大的挑战。多语种识别的困难点主要来源于不同语种之间的独特字符集、书写规则和语法结构间的差异,以及复杂的文本形态和排版方式的影响。
例如,阿拉伯语的书写方向是从右到左,而且同一字母在单词的不同位置有着不同的形态。对于这种语言,传统的文字识别方法往往难以应对;其他小语种如泰语和印地语,其书写系统相对复杂,有时一个字符可能会出现在另一个字符的上方或下方,是文字识别必须解决的问题。
为了克服这些挑战,扫描全能王在AI-Scan引擎的支持下,采用了一种结合深度学习和自然语言处理的全新方法,能够有效地处理不同语种的字符关联和顺序问题。在服务全球亿级别用户的过程中,扫描全能王对大量的多语种文本进行预训练,能够对全球41个语种的文档进行识别,满足了全球超过100个国家和地区用户的办公、生活需求。
“华盛顿邮报等媒体曾将扫描全能王称作‘手掌扫描仪’,因为这款产品实现了在低资源、性能低的移动设备下高准确率、高效率、高稳定性的识别体验。‘做小、做轻’是上一个阶段的任务,未来扫描会更多地与前沿技术的结合,进入智能化的时代。”曹超阳表示,在过去的十年里,扫描全能王是最早将图像处理、OCR、深度学习等AI技术综合运用的APP之一。未来团队将持续保持对AI底层技术的关注,用科技为全球用户提供有价值的文档智能服务。
合合信息扫描全能王发布“黑科技”,让AI替人“思考”图像处理问题的更多相关文章
- camscanner(扫描全能王)功能解析与复现
早就在用camscanner(扫描全能王)这个软件,感觉很不错. 主要功能: 1.页面截取校正 2.增强处理(灰度与颜色) 刚好最近工作与此相关,静心做点仿真,看看其中的操作原理,也做个demo玩玩. ...
- 扫描全能王 v5.13.0.20190916 去水印和广告版
说明 1.先安装1(安装完不要打开),再安装2,然后打开2,参考下图: 2.不要登录扫描全能王账号,否则会导致失败! 3.激活完成后可以卸载2 下载地址 城通网盘 蓝奏云(仅含1) 百度网盘 另外口袋 ...
- “体检医生”黑科技|让AI开发更精准,ModelArts更新模型诊断功能
摘要:华为云AI开发平台ModelArts黑科技加持AI研发,让模型开发更高效.更简单,降低AI在行业的落地门槛.全面的可视化评估以及智能诊断功能,使得开发者可以直观了解模型各方面性能,从而进行针对性 ...
- 【前端优化之拆分CSS】前端三剑客的分分合合
几年前,我们这样写前端代码: <div id="el" style="......" onclick="......">测试&l ...
- MediaScanner与音乐信息扫描==
http://www.eoeandroid.com/forum.php?mod=viewthread&tid=98713 =================================== ...
- Tidyverse|数据列的分分合合,爱恨情仇
Tidyverse|数据列的分分合合,爱恨情仇 本文首发于“生信补给站”Tidyverse|数据列的分分合合,一分多,多合一 TCGA数据挖掘可做很多分析,前期数据“清洗”费时费力但很需要. 比如基因 ...
- Banner信息扫描
Banner信息扫描 Banner一般用于表示对用户的欢迎,但其中可能包含敏感信息.获取Banner也属于信息搜索的范畴.在渗透测试中,典型的4xx.5xx信息泄露就属于Banner泄露的一种.在Ba ...
- 【Python自动化Excel】pandas处理Excel的“分分合合”
话说Excel数据表,分久必合.合久必分.Excel数据表的"分"与"合"是日常办公中常见的操作.手动操作并不困难,但数据量大了之后,重复性操作往往会令人崩溃. ...
- 【Python自动化Excel】pandas操作Excel的“分分合合”
话说Excel数据表,分久必合.合久必分.Excel数据表的"分"与"合"是日常办公中常见的操作.手动操作并不困难,但数据量大了之后,重复性操作往往会令人崩溃. ...
- 带你了解S12直播中的“黑科技”
摘要:让精彩更流畅.让较量更清晰.让参与更沉浸.让体验更有趣,幕后的舞台,从来都是技术的战场,S12背后的名场面同样场场高能. 本文分享自华为云社区<用硬核方式打开S12名场面>,作者:华 ...
随机推荐
- SMOTE与SMOGN算法R语言代码
本文介绍基于R语言中的UBL包,读取.csv格式的Excel表格文件,实现SMOTE算法与SMOGN算法,对机器学习.深度学习回归中,训练数据集不平衡的情况加以解决的具体方法. 在之前的文章S ...
- TypeScript 学习笔记 — 类型推断和类型保护(十一)
目录 类型推断 1.赋值推断 2.返回值推断 3.函数推断(反向推断) 4.属性推断 5.类型反推 6.索引访问操作符 7.类型映射 类型保护 1.typeof 类型保护 2.instanceof 类 ...
- [oeasy]python0025_ 顺序执行过程_流水_流程_执行次序
顺序执行过程_流水_流程_执行次序 回忆上次内容 上次 熟悉了 vim编辑器 操作 作用 w 向前移动光标一个word b 向后移动光标一个word :r oeasy.py 读取文件到当前文件缓存 g ...
- oeasy教您玩转vim - 005 - # 程序本质
程序本质 回忆上次内容 py 的程序是按照顺序 一行行挨排解释执行的 我们可以 python3 -m pdb hello.py 来对程序调试 调试的目的是去除 bug 别害怕 bug bug 会有 ...
- 题解:AT_arc173_b [ARC173B] Make Many Triangles
背景 前几天打了比赛,崩麻了,所以来水一篇题解.LC真睿智 题意 给你 \(n\) 个点,问最多能组成几个三角形. 分析 听说可以随机化.这道题就是一个简单贪心. 我们考虑,如果没有共线的点,那么答案 ...
- Ubuntu本地安装Docker
Ubuntu本地安装Docker 目录 Ubuntu本地安装Docker 查看Ubuntu系统版本代号 安装 修改镜像源 官方文档:Install Docker Engine on Ubuntu | ...
- js 做树形数组查询筛选功能
对二级菜单进行搜索查询: watch: { librarySearch(val) { if(val == '') { this.libraryFiles = this.libraryFilesAll ...
- python selenium 判断元素是否存在,实现:找到元素,执行对应的代码;找不到元素,继续执行其他代码
selenium因为找不到元素会抛出异常,导致执行结束 可以考虑使用driver.find_elements(),找不到元素时就会返回空列表,使用if-else语句,判断列表是否为空,非空,则正常找到 ...
- 新年恭喜发财-scratch编程作品
程序说明: <新年-恭喜发财>是一个基于Scratch平台制作的动画贺卡项目.该项目通过编程和艺术设计,展现了浓厚的中国新年(2024年为龙年)氛围,以及传统的恭喜发财祝福.动画中包含有喜 ...
- AI的技术发展:记忆与想象力 —— 【人工智能】记忆、想象与AI | 查兰·兰加纳特 | 心理学与神经科学家 | 人脑如何记忆 | 内部模型 | 稳定可塑性难题 | 想象力的由来 | AI内容传播 | 脑机接口BCI
原文地址: https://www.youtube.com/watch?v=cHYKbVP1GTQ 加利福尼亚大学戴维斯分校教授.心理学家兼神经科学家查兰·兰加纳特Charan Ranganath,最 ...