合合信息“文件转换excel”功能近半年被调用百万次

发布时间:2022-09-21 来源:中国网商务 作者:周健 责任编辑:梁长玉

周健报道 表格是文档中常见的对象,比如报名表、财务报表、票据。合合信息近日表示,高精确度的表格识别技术能够大幅节省文件处理时间,近半年来,“文件转换excel”相关功能累计被调用百万次。

高精确度的表格识别技术,是合合信息智能文字识别技术中,图像处理和复杂场景文字识别技术的重要应用。

表格识别主要包括表格检测和表格结构识别两大任务。表格检测主要检测表格主体,即从图片中确认表格区域;表格结构识别是对表格区域进行分析,提取表格中的数据与结构信息,得到表格的行列逻辑结构。

人工智能技术飞速发展,计算机视觉、自然语言处理、图神经网络等深度学习方法,被广泛引入表格识别任务中。合合信息智能文字识别技术,覆盖了图片、PDF格式文档中多种类的表格识别需求,包括有线表、三线表、无线表等,并且支持合并单元格、多表格并存等复杂情况的识别。

有线表识别中,合合信息利用语义分割、角点回归等技术方案,还原有线表,在财报相关表格识别测试中,有线表识别单元格结构准确率高于98%。

无线表识别是表格识别中的难点。合合信息采用序列模型、规则匹配等方案,通过自研模型直接预测表格的逻辑结构,再得到表格的物理结构,在保证表格区域内容的完整性的同时,检测准确率较传统方法显著提升。

合合信息智能文字识别技术中的表格识别技术已被应用于以“扫描全能王”为代表的C端APP中,通过“文件转换excel”功能服务于大众需求。近半年来,“文件转换excel”相关功能累计被调用百万次。

相关资讯

中文 English Français Deutsch 日本語
Русский язык Español عربي 한국어

中国网客户端

国家重点新闻网站,9语种权威发布

立即下载