智核-文字识别

文字识别引擎：基于 AI 深度学习算法，利用图像分析，字符识别等技术，对材料文字实现推理分析，提供文字识别能力，包括图片/PDF/OFD等材料的文字识别，可支持简体/繁体、中文/英文、打印/手写、表格/卡证等文字识别。

业务痛点

日常卡证信息识别

日常工作中经常需要对卡证信息进行识别提取，人工录入工作繁琐，且易录错；

自助业务办理信息提取

随着科技的进步，各行各业推广便民的自助业务办理服务中，往往需要智能化识别材料信息、图片信息中的关键文字，以便完成自助业务办理。

手写材料识别

初始文字识别技术大多针对印刷体材料识别，但一些行业比如教育、司法等也存在大量手写体材料，需要进行手写体识别。

设计理念

01

打造一个开放、共享的AI引擎，可多场景赋能应用；

02

打造一个可基于行业数据特点不断升级的能力引擎；

03

打造一个可支持全部国产化部署的能力平台；

总体架构

文字识别引擎的图像分析技术依托GPU显卡，并基于AI深度学习算法，为上层应用提供各类服务和请求调度分析。

核心功能

印刷体识别

手写体识别

表格识别

卡证识别

图片格式

印刷体识别

支持识别简体中文，繁体中文，英文及数字等印刷文本内容进行识别，支持常见的格式字体，识别率99%以上。

手写体识别

支持手写体识别，规范手写体识别率95%以上。

表格识别

支持对表格类材料进行识别，自动识别并定位表格线及表格内容，结构化输出表头、表尾及每个单元格的文字内容。

卡证识别

支持对身份证、户口簿、银行卡、律师证、驾驶证、行驶证等常见卡证类材料进行识别，并可支持模版自定义来支持更多卡证种类识别。

图片格式

支持 TIFF、BMP、JPG、PNG、PDF、OFD 等多种格式的图片输入，识别结果可保存成 TXT、PDF，ODF 等文本格式文件；输出 PDF 和 OFD 文件对原始图片进行格式还原和对比，可对文本内容进行选择复制。

价值特点

01

行业数据打磨

专业训练数百万份纸质档案材料，擅长处理各类复印件、扫描件的文字识别针对业务材料中经常出现的“折痕、污损、线条勾勒、印章指纹、倾斜、装订孔”等现象，可自动检测并优化，过滤干扰因素，提高识别率

02

表格识别定向优化

支持对有线表格、无线表格、三线表等各类表格数据识别，可精准重绘表格线并识别表格内文字内容

03

接口标准完备

支撑9个行业内30余种应用场景，提供标准API服务，可多场景同时调用时，分优先级管理，多线程并发

04

私有化成熟度高

私有化部署成熟度极高，X86、通用信创、SM信创等各种环境均已支持，且有大量实践案例

首次体验，请先注册
在线咨询

用微信扫描二维码，即可获得您的专属顾问