近期,合合信息智能文字识别产品通过中国信息通信研究院(以下简称“中国信通院”)“可信AI—智能文档处理系统”评估工作,并获得“5级”评定。“5级”是该模块最高评定等级。
中国信通院于2018年起逐步构建和完善“可信AI”评测体系,助力人工智能技术的发展和产业的健康成长,“智能文档处理”是近两年来新增的评测项目之一。
计算机信息化系统中的数据分为结构化数据和非结构化数据,人们日常生活、工作中所接触到的各类办公文档、文本、图片、报表都属于非结构化数据。由于格式复杂、标准多样,非结构化数据处理起来既困难又耗时,智能文档处理技术可以把关键信息从半结构化、非结构化数据中提取出来,进一步实现业务流程的端到端自动化。智能文档处理技术是提升部分行业、业务、流程的核心生产要素,随着与应用和流程自动化的深度整合,潜在的应用场景广泛,普及空间较大。
智能文档处理技术已被广泛应用于文档数字化管理、自动化流程、图文提取等业务场景,并加速渗透金融、政务、医疗、海关等垂直领域。中国信通院持续关注智能文档处理技术及应用的发展情况,依据《自然语言处理技术和产品评估方法第8部分:智能文档处理系统》,全方位评估企业智能文档处理的技术先进度。而评估结果显示,合合信息智能文档处理产品在通用能力及AI核心能力方面均表现优异,在通用能力方面,合合信息产品的信息抽取、表格文字识别、版面分析等方面均获得5分评分;在AI核心能力方面,合合信息产品的知识图谱领域的实体识别、关系抽取等能力也获得5分评分。
本月,中国信通院携手合合信息启动了《文档图像篡改检测标准》制定工作,中国科学技术大学等知名学术机构参与联合编制。该检测标准将基于产业现状,围绕“细粒度”视觉差异伪造图像鉴别、生成式图像判别等行业焦点议题,凝聚行业共识,为中国“可信AI”在机器视觉、图像处理领域的体系建设提供有力支持。