400-9918-728
智核-文字识别
文字识别引擎:基于 AI 深度学习算法,利用图像分析,字符识别等技术,对材料文字实现推理分析,提供文字识别能力,包括图片/PDF/OFD等材料的文字识别,可支持简体/繁体、中文/英文、打印/手写、表格/卡证等文字识别。

业务痛点

日常卡证信息识别

日常工作中经常需要对卡证信息进行识别提取,人工录入工作繁琐,且易录错;

自助业务办理信息提取

随着科技的进步,各行各业推广便民的自助业务办理服务中,往往需要智能化识别材料信息、图片信息中的关键文字,以便完成自助业务办理。

手写材料识别

初始文字识别技术大多针对印刷体材料识别,但一些行业比如教育、司法等也存在大量手写体材料,需要进行手写体识别。

设计理念

01

打造一个开放、共享的AI引擎,可多场景赋能应用;

02

打造一个可基于行业数据特点不断升级的能力引擎;

03

打造一个可支持全部国产化部署的能力平台;

总体架构

文字识别引擎的图像分析技术依托GPU显卡,并基于AI深度学习算法,为上层应用提供各类服务和请求调度分析。

核心功能

印刷体识别

手写体识别

表格识别

卡证识别

图片格式

印刷体识别

支持识别简体中文,繁体中文,英文及数字等印刷文本内容进行识别,支持常见的格式字体,识别率99%以上。

手写体识别

  支持手写体识别,规范手写体识别率95%以上。

表格识别

支持对表格类材料进行识别,自动识别并定位表格线及表格内容,结构化输出表头、表尾及每个单元格的文字内容。

卡证识别

支持对身份证、户口簿、银行卡、律师证、驾驶证、行驶证等常见卡证类材料进行识别,并可支持模版自定义来支持更多卡证种类识别。

图片格式

支持 TIFF、BMP、JPG、PNG、PDF、OFD 等多种格式的图片输入,识别结果可保存成 TXT、PDF,ODF 等文本格式文件;输出 PDF 和 OFD 文件对原始图片进行格式还原和对比,可对文本内容进行选择复制。

价值特点

01

行业数据打磨

专业训练数百万份纸质档案材料,擅长处理各类复印件、扫描件的文字识别针对业务材料中经常出现的“折痕、污损、线条勾勒、印章指纹、倾斜、装订孔”等现象,可自动检测并优化,过滤干扰因素,提高识别率

02

表格识别定向优化

支持对有线表格、无线表格、三线表等各类表格数据识别,可精准重绘表格线并识别表格内文字内容

03

接口标准完备

支撑9个行业内30余种应用场景,提供标准API服务,可多场景同时调用时,分优先级管理,多线程并发

04

私有化成熟度高

私有化部署成熟度极高,X86、通用信创、SM信创等各种环境均已支持,且有大量实践案例

  • 首次体验,请先注册
  • 在线咨询

    用微信扫描二维码,即可获得您的专属顾问