“垂直领域大模型论坛”分享合合信息智能文档处理技术

发布时间：2024-01-05 来源：中国网商务作者：周健责任编辑：沈晔

近期，合合信息联合琶洲实验室、华南理工大学、中山大学等，共同承办了“垂直领域大模型论坛”，汇聚高校及办公、医疗、工业等多个行业代表性企业的技术专家，共同分享前沿技术成果与实战思路，为大模型在垂直领域中的应用，寻找新的落脚点。

文档处理是垂直领域大模型的重要研究方向。受制于图像质量低下，版式丰富，文字字体、颜色多样等因素的影响，文档图像智能分析与理解能力的大幅度提升面临着挑战。

合合信息智能技术平台事业部副总经理、高级工程师丁凯博士，在此次论坛上分享，“在智能文档处理领域，大模型支持识别和理解的文档元素类型，远超传统算法，大幅度拓展了AI技术在文档分析与识别领域的能力边界，端到端实现了文档从识别到理解的全过程。不足在于，目前大模型的OCR精度，距离领域最佳模型，有较大差距，长文档依赖外部的文档解析引擎。”丁凯认为，技术公司可以把“感知”层面的事情做好，让大模型更好地去做“认知”，这种融合研究范式，在智能文档处理领域中，具有积极的意义。

目前，合合信息-华南理工大学文档图像分析识别与理解联合实验室，针对大模型文档处理中的像素级OCR统一模型、OCR大一统模型等重点技术方向，进行了深入研究，相关工作成果在文本去除、文本分割和篡改文本检测任务上，得到了广泛验证。此外，实验室还通过创新的文档识别分析与LLM（自然语言模型）应用设计，充分利用序列预测的优势，更好地解决文档图像处理中的多样化任务需求，并且通过与LLM的结合，实现了更高层次的文档理解和分析，为文档图像处理领域带来了更多可能性。

“垂直领域大模型论坛”分享合合信息智能文档处理技术

相关资讯

要闻

会客厅

推荐资讯