“垂直领域大模型论坛”分享合合信息智能文档处理技术

发布时间:2024-01-05 来源:中国网商务 作者:周健 责任编辑:沈晔

近期,合合信息联合琶洲实验室、华南理工大学、中山大学等,共同承办了“垂直领域大模型论坛”,汇聚高校及办公、医疗、工业等多个行业代表性企业的技术专家,共同分享前沿技术成果与实战思路,为大模型在垂直领域中的应用,寻找新的落脚点。

文档处理是垂直领域大模型的重要研究方向。受制于图像质量低下,版式丰富,文字字体、颜色多样等因素的影响,文档图像智能分析与理解能力的大幅度提升面临着挑战。

合合信息智能技术平台事业部副总经理、高级工程师丁凯博士,在此次论坛上分享,“在智能文档处理领域,大模型支持识别和理解的文档元素类型,远超传统算法,大幅度拓展了AI技术在文档分析与识别领域的能力边界,端到端实现了文档从识别到理解的全过程。不足在于,目前大模型的OCR精度,距离领域最佳模型,有较大差距,长文档依赖外部的文档解析引擎。”丁凯认为,技术公司可以把“感知”层面的事情做好,让大模型更好地去做“认知”,这种融合研究范式,在智能文档处理领域中,具有积极的意义。

目前,合合信息-华南理工大学文档图像分析识别与理解联合实验室,针对大模型文档处理中的像素级OCR统一模型、OCR大一统模型等重点技术方向,进行了深入研究,相关工作成果在文本去除、文本分割和篡改文本检测任务上,得到了广泛验证。此外,实验室还通过创新的文档识别分析与LLM(自然语言模型)应用设计,充分利用序列预测的优势,更好地解决文档图像处理中的多样化任务需求,并且通过与LLM的结合,实现了更高层次的文档理解和分析,为文档图像处理领域带来了更多可能性。

相关资讯

中文 English Français Deutsch 日本語
Русский язык Español عربي 한국어

中国网客户端

国家重点新闻网站,9语种权威发布

立即下载