合合信息与各方专家共话文档图像处理领域的未来

发布时间:2023-05-17 来源:中国网商务 作者:周健 责任编辑:梁长玉

近日在苏州举行的中国图象图形大会(CCIG 2023),亮点之一是技术论坛《文档图像智能分析与处理》。在该论坛上,合合信息智能技术平台事业部副总经理、高级工程师丁凯博士,与中科院、北大、中科大、华为的专家,探讨文档图像处理领域的未来进阶方向。

近期火爆的ChatGPT,让“大模型”技术进入了公众的视野。中国科学院自动化研究所副所长刘成林认为,大模型与光学字符识别(OCR)技术的结合,能够对海量数据进行理解、处理。北京大学邹月娴教授认为,在与文档图像处理技术密切相关的OCR领域中,专业化大规模的预训练模型是可行的。

(丁凯就《智能文档处理技术在工业界的应用与挑战》研究课题进行分享)

人工智能大模型的快速发展为文档分析与识别带来了一些机遇,除了解决识别层次的遗留问题,在性能提升、应用拓展上大有可为。合合信息通过ROI提取、干扰去除、形变矫正、图像恢复以及图像增强,将文档图像的弯曲矫正、摩尔纹去除,图像质量大幅提升;针对手写板图片中出现的反光问题,通过算法模型对反光进行“擦除”;通过智能文字识别、智能图像处理等核心技术,确定文档中的文字位置、字体、大小和排版方式等信息,实现版面的分析和还原。

利用人工智能的合成技术,伪造的多媒体信息在网络上泛滥。中科大教授谢洪涛指出,随着基于深度学习的伪造与取证技术的出现,目前文本图像的真伪鉴定问题进入了攻防博弈阶段。

合合信息在文档图像内容安全领域也进行了深入的部署。据丁凯介绍,合合信息研发了基于深度学习的图像篡改检测技术及相关系统,可以智能捕捉图像在篡改过程中留下的细微痕迹,检测出复制粘贴、拼接、擦除等多种篡改形式,进行针对性的处理。合合信息图像篡改检测技术已被银行、保险、制造业等多个行业引入。

作为人工智能企业,合合信息依托智能文档处理技术,对复杂场景下的多版式、多语种文字内容进行精准提取,打造的合同机器人、财报机器人及行业解决方案,已在金融、政务、制造、物流等30个行业落地,服务的世界500强公司超过80家。未来,合合信息将持续为全球C端用户和多元行业B端客户提供数字化、智能化的产品及服务,促进AI技术在文档处理领域的应用落地与信息安全保障。(企业供图)

相关资讯

中文 English Français Deutsch 日本語
Русский язык Español عربي 한국어

中国网客户端

国家重点新闻网站,9语种权威发布

立即下载