合合信息智能文字识别服务平台以SaaS形式免费开放

发布时间:2022-10-25 来源:中国网商务 作者:周健 责任编辑:梁长玉

周健报道   近期举办的CSDN(中国开发者网络)第三届“1024程序员节”,合合信息智能创新事业部总经理唐琪,受邀分享智能文档处理的技术优化方法及开源渠道。

智能文档处理技术,本质上是把文档里的信息从载体中剥离出来,将其对接到其他系统,以数据的流转,实现流程自动化的技术。典型场景如单据的自动审核,就是先对单据进行图像检测,从中提取所需信息并录入到系统里,经过结构化处理,“翻译”成机器能理解的内容后,再进行自动判别,达到节省人工成本、提高工作效率的目的。

唐琪在分享中指出,采集设备的不确定性和文档版式的多样性,导致文档在处理过程中经常遇到“看不清、看不准、认不全、难理解”四大类问题。合合信息在弯曲矫正、去摩尔纹(屏幕纹)等图像质量增强领域,进行了深入研究,为信息的提取、存储、检索、管理等后续工作创造良好的环境。

合合信息在制造业、金融业、物流业等30个行业应用里,打磨出的核心技术产品“智能文字识别服务平台”(简称“平台”),以SaaS的形式免费开放给个人开发者,助力使用者们低成本、高效率获取贴合个性化需求的定制模型。

合合信息智能文档处理技术,可支持全球超过50种主流语言的印刷体、手写体的高精度识别,以及增值税发票、出租车票等20多种票据的识别,这些通用识别、信息抽取能力,被搭载于合合信息智能文字识别服务平台SaaS版。该平台提供了海量训练数据快速生成、自动化模型生成、完整的模型训练和测试等功能,具备低使用门槛、所需样本少、开发周期短的优势,使用者通过云端的简单操作,即可定制提取标准和非标准版式文档的结构化信息,仅需10张样本就可以开始训练。实测中,应用人员最短可在10分钟内完成抽取模型开发全流程。可视化界面设计,让没有算法基础的业务人员也可顺利使用。

相关资讯

中文 English Français Deutsch 日本語
Русский язык Español عربي 한국어

中国网客户端

国家重点新闻网站,9语种权威发布

立即下载