3月18日,由中国图象图形学学会(CSIG)主办,合合信息、CSIG文档图像分析与识别专业委员会联合承办的“CSIG企业行”系列活动成功举办。此次活动以“图文智能处理与多场景应用技术展望”为主题,特邀来自上海交大、厦门大学、复旦大学、中科大的知名学府的学者与合合信息技术团队一道,面向行内研究者分享图像文档处理中的结构建模、底层视觉技术、跨媒体数据协同应用、生成式人工智能及对话式大型语言模型等研究及实践成果。

研讨会嘉宾合影

“CSIG企业行”活动旨在汇集产学研各界资源,探讨图文智能信息技术领域的最新发展动态和未来趋势,共同推动图像图形领域的发展。会议开始,合合信息董事长、总经理镇立新博士 发表致辞,对各位嘉宾、各位参加本次活动朋友们表达了热烈欢迎,向与会代表介绍了合合信息,并表示,合合信息在智能文字识别(OCR)、图像处理、自然语言处理(NLP)、知识图谱、大数据挖掘等核心技术领域深耕十余年,自主研发的扫描全能王、名片全能王等C端产品深受全球上亿用户的欢迎,服务了30个行业的企业客户。

镇立新指出,希望通过这次活动,增进彼此之间的友谊和合作,寻求产学研合作机会,为推动图像图形及人工智能行业的发展和进步贡献智慧和力量。

合合信息董事长、总经理镇立新博士致辞

随后,CSIG文档图像分析与识别专业委员会主任金连文教授进行了致辞,金连文教授向各位与会代表介绍了中国图象图形学学会的概况,包括学会的组织架构、学会开展的各种学术会议、学术活动、讲习班、会员服务、科技评奖、成果鉴定等服务,欢迎大家加入中国图象图形学学会成为会员,也欢迎大家积极参加CSIG举办的各种学术活动。

CSIG文档图像分析与识别专委会主任金连文教授致辞

理论探索:生成式人工智能将成为未来十年的研究重心

据国际IT研究机构Gartner预测,到2025年,生成式人工智能产生的数据将占据人类全部数据的10%。生成式人工智能技术正加速数字经济的发展。“企业行”活动中,上海交通大学人工智能研究院常务副院长、长江学者杨小康分享了团队在生成式人工智能领域的工作,并表示,目前的生成式人工智能还存在解空间巨大、宏观一致性差、微观清晰度受限等问题,需要通过数学、物理、信息论、脑认知、计算机等学科交叉研究,进一步夯实生成式人工智能的基础理论,通过“物理+数据”联合驱动, “虚拟+现实”深度融合,助力科学发现的加速。

上海交通大学人工智能研究院常务副院长、国家杰青、IEEE Fellow杨小康教授进行《生成式人工智能与元宇宙》主题分享

杨小康认为,以“识别——分析”为代表的判别式人工智能推动了人工智能前十年的发展,接下来十年,以“合成——重建”为代表的生成式人工智能将成为主流。

近期频频上“热搜”的ChatGPT是生成式人工智能的典型代表。复旦大学计算机学院教授、上海市计算机学会自然语言处理专委会主任邱锡鹏提到,强大的情景学习能力、思维链能力和自然指令学习能力是以ChatGPT为代表的对话式大型语言模型的主要特点,将加速通用人工智能的实现。

复旦大学计算机学院教授、国家优青、上海市计算机学会自然语言处理专委会主任邱锡鹏进行《对话式大型语言模型》主题分享

据悉,今年2月,复旦大学自然语言处理实验室发布了国内第一个对话式大型语言模型“MOSS”,引发业内广泛关注,邱锡鹏是主要作者之一。“文本所承载的知识只是冰山一角,还有很多‘暗知识’并不是以文本形式记录的。在未来的发展里,人工智能还有‘具身学习、跨模态学习’等更多知识领域需要学习。”邱锡鹏说。

学术前沿:复杂场景多模态数据分析与理解进展迅速

人工智能要实现多场景“通用”,需要解决多源数据的问题。“文本、图像、视频是互联网上存量最大的数据,需研发相关算法对其进行有效管理。”厦门大学科技处处长、人工智能研究院负责人纪荣嵘教授认为,社交媒体等信息渠道包含了海量非合作、异构化、跨模态的数据,既蕴藏了大量的人类知识与高价值信息,也包含了各种自然与人为的噪声,对其分析与处理需要融合类脑计算、计算机视觉、自然语言处理等多个维度的智能技术。

厦门大学人工智能研究院负责人、国家杰青纪荣嵘教授进行《复杂跨媒体数据协同分析与应用》主题分享

纪荣嵘指出,连接视觉与自然语言的“视觉描述”领域,是最受关注且最具潜力的人工智能研究任务之一 。视觉和语言的研究应是双向的,各自的新发现、新方法可以互相迭代促进。跨空间、跨领域、跨任务知识迁移方面有较大探索空间,易于发现新的科学问题 。

落地实践:图像文档结构分析、底层视觉技术发展受关注

语言文字和视觉研究的融合也为技术落地创造出新的发展空间。近年来,人工智能与OCR(光学字符识别)技术的结合愈发紧密,图像文档中涉及的复杂结构如汉字结构、表格结构、文档总体结构的建模问题,逐渐成为研究热点。中国科学技术大学语音及语言信息处理国家工程研究中心副教授杜俊就团队在文档结构层次化重建领域的最新进展进行分享。

中国科学技术大学语音及语言信息处理国家工程研究中心副教授杜俊进行《面向图像文档的复杂结构建模研究》主题分享

“现阶段文档分析任务中,大多数研究是针对单页内的文章要素的解析,但从内容角度看,许多文档页与页之间内容有关联。”杜俊表示,图像文档处理能力要达到“篇章级”,突破手写、自然场景下的汉字建模难点,做好跨页文档的要素分类、文档结构恢复是团队的主要研究目标。

底层视觉是智能文档处理的重要研究方向之一,主要研究如何提高或恢复各类场景下的图像、视频内容,如清晰度提升,低质量及破损图像恢复等,相关理论和方法在手机图像采集与处理,医疗图像分析等领域发挥着至关重要的作用。合合信息图像算法研发总监郭丰俊博士针对目前底层视觉技术在处理形变、模糊、阴影遮盖、背景杂乱的文档时遇到的典型问题,就公司技术团队在智能图像处理技术模块、融合技术典型应用、图像安全领域等领域的研究成果进行了分享。

合合信息图像算法研发总监郭丰俊进行《文档图像处理中的底层视觉技术》进行分享

郭丰俊提到,合合信息智能文档处理技术基于对图像目标区域的精准裁剪,对弯曲、倾斜透视的页面进行形变矫正,在去除阴影、摩尔纹后,通过人工智能技术对文档图像进行增强锐化和清晰度提升,达到“图像质量增强”的效果,在改善阅读体验的同时,也提升了识别转换、图像分析等文档处理下游任务的质效,相关技术已通过“扫描全能王”等智能文字识别产品,服务全球上百个国家和地区的上亿用户。

学术报告结束后,各位与会代表参观了合合信息展厅,与合合信息技术人员进行了热烈的交流互动。 大会特邀嘉宾还与合合信息的技术研发人员就图形图像处理、人工智能等领域的前沿技术问题、产学研合作、ChatGPT技术发展趋势及对产业的影响等议题进行了深入广泛的讨论和交流。

CSIG企业行-走进合合信息成功举行,聚焦生成式人工智能、智能文档处理前沿热点的更多相关文章

  1. springboot+swagger接口文档企业实践(下)

    目录 1.引言 2. swagger接口过滤 2.1 按包过滤(package) 2.2 按类注解过滤 2.3 按方法注解过滤 2.4 按分组过滤 2.4.1 定义注解ApiVersion 2.4.2 ...

  2. 如何用代码读取Office Online Server2016的文档的备注信息

    前言 在一个项目上客户要求读取office online server 2016的对文档的备注信息,如下图: 以前思路老纠结在OOS这个在线上,总有以为这个信息存储在某个列表中,其实错了,这个备注信息 ...

  3. MFC用串行化实现文档存储和读取功能

    在面向对象的程序设计中,一般都是用二进制文件来保存文档资料.在VC++中控制和使用文件流的方法很多,MFC程序设计中常用的有两种方法:用CFile对象存储和读取文件:利用串行化存取文件.其中用CFil ...

  4. 生成式AI对业务流程有哪些影响?企业如何应用生成式AI?一文看懂

    集成与融合类ChatGPT工具与技术,以生成式AI变革业务流程 ChatGPT背后的生成式AI,聊聊生成式AI如何改变业务流程 ChatGPT月活用户过亿,生成式AI对组织的业务流程有哪些影响? 生成 ...

  5. 【前端优化之拆分CSS】前端三剑客的分分合合

    几年前,我们这样写前端代码: <div id="el" style="......" onclick="......">测试&l ...

  6. Tokyocabinet/Tokyotyrant文档大合集

    1. 前言 这里不是我个人原创,是我对网络上整理到的资料的再加工,以更成体系,更方便研究阅读.主要是对其中跟主题无关的文字删除,部分人称稍做修改;本人无版权,您可以将本页面视为对参考页面的镜像.第二部 ...

  7. Tidyverse|数据列的分分合合,爱恨情仇

    Tidyverse|数据列的分分合合,爱恨情仇 本文首发于“生信补给站”Tidyverse|数据列的分分合合,一分多,多合一 TCGA数据挖掘可做很多分析,前期数据“清洗”费时费力但很需要. 比如基因 ...

  8. 【Python自动化Excel】pandas处理Excel的“分分合合”

    话说Excel数据表,分久必合.合久必分.Excel数据表的"分"与"合"是日常办公中常见的操作.手动操作并不困难,但数据量大了之后,重复性操作往往会令人崩溃. ...

  9. 【Python自动化Excel】pandas操作Excel的“分分合合”

    话说Excel数据表,分久必合.合久必分.Excel数据表的"分"与"合"是日常办公中常见的操作.手动操作并不困难,但数据量大了之后,重复性操作往往会令人崩溃. ...

  10. 删除datatable的行后,出现“不能通过已删除的行访问该行的信息”的错误,即DeletedRowInaccessibleException

    删除datatable的行后,出现“不能通过已删除的行访问该行的信息”的错误 =========================================================== 采 ...

随机推荐

  1. oeasy教您玩转vim - 27 - 文件类型

    ​ 文件类型 回忆上节课内容 上次了解了缩进的各种方式 正常模式下用 << 缩进 插入模式下用 tab 缩进 显示缩进情况 :set listchars=eol:$,tab:>-,s ...

  2. 从Mybatis-Plus开始认识SerializedLambda

    从Mybatis-Plus开始认识SerializedLambda 背景 对于使用过Mybatis-Plus的Java开发者来说,肯定对以下代码不陌生: @TableName("t_user ...

  3. vue小知识~注入provide!

    注入表示的是将该组件的相关值,方法,实例向后代组件注入. 祖先元素中定义注入: export default { provide() { return { provideName: provideVa ...

  4. 文件系统(十一):Linux Squashfs只读文件系统介绍

    liwen01 2024.07.21 前言 嵌入式Linux系统中,squashfs文件系统使用非常广泛.它主要的特性是只读,文件压缩比例高.对于flash空间紧张的系统,可以将一些不需要修改的资源打 ...

  5. RHCA rh442 010 文件系统结构 BDP调优 网卡驱动带宽

    文件系统结构 用户通过虚拟文件系统,访问底层的文件系统 对于一块磁盘而言,MBR + 分区表记录硬盘的信息 对于一个分区而言,这个分区的第一个块,superblock,超级块,记录分区元数据信息 对于 ...

  6. 【vue3】详解单向数据流,大家千万不用为了某某而某某了。

    总览 Vue3 的单向数据流 尽信官网,不如那啥. vue的版本一直在不断更新,内部实现方式也是不断的优化,官网也在不断更新. 既然一切皆在不停地发展,那么我们呢?等着官网更新还是有自己的思考? 我觉 ...

  7. 【JavaScript】JQuery-Ztree 演示demo

    使用CDN引用JQuery和ZTree的资源 demo页的代码: <!DOCTYPE html> <html lang="en"> <head> ...

  8. 【Java】MuliThread 多线程

    程序Program 是完成特定人,用某种语言编写的一组指令集合,即一段静态代码,静态对象 进程Process 是程序的一次执行过程,可以是一个正在执行的程序 - 程序是静态的,进程是动态的 - 进程是 ...

  9. 小米(xiaomi)自动驾驶技术的原始技术积累 —— CyberDog 仿生四足机器狗

    相关: https://www.youtube.com/watch?v=f0q8tfZ89Qo 小米公司一直没有加入到制造电动车的行列中,直到几年前才感觉造车是必须要走的路了,但是造车就一定是要造电动 ...

  10. DQN2013代码尝试复现版(存在各种实现问题及Bug,个人尝试复现版,没有follow价值)

    在网上找的各种dqn代码修改而成,只实现了基本功能,对各个游戏的适配性没有进行,代码中还存在各种bug,属于草稿品质,不适合fellow,只是一时学习之用而进行尝试的残次半成品.核心代码已实现,为DQ ...