智核-语音识别

语音识别服务一款面向全行业的产品，提供语音转文字的服务，使用行业专用垂直引擎，实现任意场景下的所言即所得。

业务痛点

说话速度快导致会议记录不全

工作会议、谈话过程中，记录、纪要占据了大量的人工工作，秘书在这种场景中，需要紧张地做记录，还可能会有信息损失，为了使秘书能够记录下来，还有可能需要特意控制讲话速度，除此之外，记录之后的校对工作也需要反复核对。

重要会议无法快速回顾

尽管有一些录视频、录音的手段，但是查看视频、回听录音会占用大量的时间，视频和录音资源往往得不到有效的利用。

识别效果不能满足场景使用

语音识别技术近年来有着突飞猛进的发展，识别准确率不断提升，总体上来说，在记录、转写方面已经超过了人工效率。但实际使用时不能很好的针对不同的领域场景进行有效识别。

设计理念

01

打造一个开放、共享的AI引擎，可多场景赋能应用；

02

打造一个可基于行业数据特点不断升级的能力引擎；

03

打造一个可支持全部国产化部署的能力平台；

总体架构

语音识别引擎基于AI深度学习算法，为上层应用提供各类服务和请求调度分析。

核心功能

语音实时转文字

热词设置

文本材料自学习

分角色转写

录音文件转写

语音实时转文字

能够将语音实时转写成文字，实时上屏显示，能够支持编辑修改，多种插入模式选择，回听校对等功能。

热词设置

可以将专用词语，如姓名、地址等设置为热词，提高识别准确。

文本材料自学习

支持导入文本材料进行大段文字学习，包括会议材料、裁判文书等，以提高识别效果。

分角色转写

可以进行分角色实时转写，并可以进行角色名称设置。

录音文件转写

转写音视频资料，调用语音识别服务进行转写分析，并转化成对应语段的文本，在预览界面选择相应的文本段，音视频内容即可跳转到对应的时间线。若结果中有敏感词汇，则会进行特殊提示。支持对转写后的文字进行编辑修改、分享、查询替换、导出等功能...

价值特点

01

丰富的自学习模式

系统提供不同种类的自学习模式，包括专有名词（人名、地名、公司名等）特定的文本（文书、卷宗、发言稿等）以及实操短句（实操修改后发生纠正的词语），以提高识别效果。

02

行业专用引擎

针对不同的行业场景进行数据训练,使得业务数据与底层能力深度融合，已解决不同场景下的识别效果差异。

03

完备的解决方案

能提供针对不同场景下的完整的语音识别（前端拾音-处理-后端输出）解决方案。

04

标准化、规范化

严格按国家及相关地区的建设标准规范而建设，提供标准的接口规范，实现第三方系统快速对接。

05

多样的辅助记录形式

根据不同的业务场景需求，提供不同的辅助记录形式，包括全文记录，摘要记录以及模板记录等模式。

06

友好的系统交互感

基于Word/WPS研发前端应用，不改变用户日常记录惯，可复用Word/WPS全部功能，加入语音辅助记录。

首次体验，请先注册
在线咨询

用微信扫描二维码，即可获得您的专属顾问