合合信息的智能文字识别技术给钟鼎文断句

发布时间:2022-09-01 来源:中国网商务 作者:周健 责任编辑:梁长玉

周健报道   2022世界人工智能大会,9月1日在上海开幕。一篇镌刻在西周青铜鼎面的钟鼎文,难倒了不少参观者,比如,“克曰穆朕文且師華父悤譲氒心宁静于猷淑哲氒”,应该怎么断句?合合信息的智能文字识别AI(人工智能)系统,在无人干预的状态下,给出了答案。

合合信息在今年的世界人工智能大会上,展示的智能文字识别技术,主要由以“弯曲矫正”为代表的智能图像处理,基于深度学习的复杂场景文字识别,自然语言处理(NLP),三大核心模块组成。

智能图像处理技术可对曲面、阴影、摩尔纹等复杂场景下的文档图像进行精准的矫正处理,为接下来的文字信息提取、识别创造了良好的条件;复杂场景文字识别技术主要利用手写印刷混排识别,抗强干扰识别,扭曲文字识别等一系列深度学习技术,进行文字提取及识别,并结合领先的NLP技术,对识别出的结果进行语义理解。

本次展示的钟鼎文识别项目,是继去年的甲骨文识别之后,合合信息向古文字识别发起的又一次冲锋。大会现场还可使用公司旗下产品“扫描全能王APP”,用“拍图识字”功能一键识别竖排的繁体古籍《桃花源记》,将其转化为易于阅读的横排、简体版本。

合合信息“PS篡改检测”功能是智能文字识别技术的另一大亮点。该技术主要采用神经网络捕捉图像在篡改过程中留下的细微痕迹,不仅可以判断图片是否被篡改,还能定位修改区域,以热力图形式展示PS区域,检测准确率远超传统技术方法和人眼判断。这种证照识别,适用于保险、银行、证券、政务等多种场景。

近3年来,合合信息先后在智能国际竞赛中斩获15项冠军,学术成果在行业顶级会议上发表,相关项目获中国图象图形学学会(CSIG)科技进步奖二等奖。在今年8月的CSIG图像图形技术挑战赛中,合合信息参与的赛队夺得总冠军。(企业供图)

相关资讯

中文 English Français Deutsch 日本語
Русский язык Español عربي 한국어

中国网客户端

国家重点新闻网站,9语种权威发布

立即下载