合合信息在2024中国图象图形大会为大模型阅读理解“提分”

发布时间:2024-05-29 来源:中国网商务 作者:周健 责任编辑:沈晔

2024中国图象图形大会,近日在西安举行,通过二十多场论坛、百余项成果,集中展示了生成式人工智能、大模型、机器学习、类脑计算等多个图像图形领域的进展。

大会期间,上海合合信息科技股份有限公司(简称“合合信息”)与有关方面,联合主办了《大模型技术及其前沿应用》论坛,来自华南理工大学、上海交通大学、清华大学、复旦大学、上海人工智能实验室等高校、研究机构及企业的专家代表,就大模型技术在图像领域的发展、应用进行了深入研讨。

文档解析技术的进步,让机器能够识别文档中的多种元素,更好地处理文本、表格、图像等多类型数据,还原文档阅读顺序,加速大模型训练与应用。

论坛上,合合信息智能创新事业部研发总监常扬,分享了合合信息智能文档处理技术,在文档解析领域的工作,给与会者带来了新的技术视角。

通过十几年技术积淀,合合信息打通了电子档解析、扫描档图像处理、文字识别、表格识别、版面分析、版面还原和排版布局等文档智能化处理的全流程,面对电子文档及扫描件,能够灵活地识别文字、表格、无线表、跨页表格、页眉、页脚、公式、图像、流程图等版面元素,准确地还原文档阅读顺序,为大模型领域提供了精准的训练语料与文档问答应用体验。

常扬表示,近年来的开放词汇目标检测(OVD),视觉语义对齐(Alignment)等工作,以及生成式模型等前沿进展,将给版面分析带来新的研究思路。合合信息技术团队也将持续在智能文档处理领域深耕,让新技术更快速地产生价值。(合合信息供图)

相关资讯

中文 English Français Deutsch 日本語
Русский язык Español عربي 한국어

中国网客户端

国家重点新闻网站,9语种权威发布

立即下载