400-9918-728
智核-语音识别
语音识别服务一款面向全行业的产品,提供语音转文字的服务,使用行业专用垂直引擎,实现任意场景下的所言即所得。

业务痛点

说话速度快导致会议记录不全

工作会议、谈话过程中,记录、纪要占据了大量的人工工作,秘书在这种场景中,需要紧张地做记录,还可能会有信息损失,为了使秘书能够记录下来,还有可能需要特意控制讲话速度,除此之外,记录之后的校对工作也需要反复核对。

重要会议无法快速回顾

尽管有一些录视频、录音的手段,但是查看视频、回听录音会占用大量的时间,视频和录音资源往往得不到有效的利用。

识别效果不能满足场景使用

语音识别技术近年来有着突飞猛进的发展,识别准确率不断提升,总体上来说,在记录、转写方面已经超过了人工效率。但实际使用时不能很好的针对不同的领域场景进行有效识别。

设计理念

01

打造一个开放、共享的AI引擎,可多场景赋能应用;

02

打造一个可基于行业数据特点不断升级的能力引擎;

03

打造一个可支持全部国产化部署的能力平台;

总体架构

语音识别引擎基于AI深度学习算法,为上层应用提供各类服务和请求调度分析。

核心功能

语音实时转文字

热词设置

文本材料自学习

分角色转写

录音文件转写

语音实时转文字

能够将语音实时转写成文字,实时上屏显示,能够支持编辑修改,多种插入模式选择,回听校对等功能。

热词设置

可以将专用词语,如姓名、地址等设置为热词,提高识别准确。

文本材料自学习

支持导入文本材料进行大段文字学习,包括会议材料、裁判文书等,以提高识别效果。

分角色转写

可以进行分角色实时转写,并可以进行角色名称设置。

录音文件转写

转写音视频资料,调用语音识别服务进行转写分析,并转化成对应语段的文本,在预览界面选择相应的文本段,音视频内容即可跳转到对应的时间线。若结果中有敏感词汇,则会进行特殊提示。支持对转写后的文字进行编辑修改、分享、查询替换、导出等功能...

价值特点

01

丰富的自学习模式

系统提供不同种类的自学习模式,包括专有名词(人名、地名、公司名等)特定的文本(文书、卷宗、发言稿等)以及实操短句(实操修改后发生纠正的词语),以提高识别效果。

02

行业专用引擎

针对不同的行业场景进行数据训练,使得业务数据与底层能力深度融合,已解决不同场景下的识别效果差异。

03

完备的解决方案

能提供针对不同场景下的完整的语音识别(前端拾音-处理-后端输出)解决方案。

04

标准化、规范化

严格按国家及相关地区的建设标准规范而建设,提供标准的接口规范,实现第三方系统快速对接。

05

多样的辅助记录形式

根据不同的业务场景需求,提供不同的辅助记录形式,包括全文记录,摘要记录以及模板记录等模式。

06

友好的系统交互感

基于Word/WPS研发前端应用,不改变用户日常记录惯,可复用Word/WPS全部功能,加入语音辅助记录。

  • 首次体验,请先注册
  • 在线咨询

    用微信扫描二维码,即可获得您的专属顾问