讯飞语音+介绍
讯飞语音+提供的语音服务主要包括语音合成、语音识别、语义理解(声纹识别、唤醒目前接口已经定义,但还不支持,会在后续的版本中集成)。语音合成是指将文本转为声音,让机器能够“说话”;语音识别是指将声音转为文字,让机器能够“听话”;语义理解是指能够辨别用户的说话行为和关键信息,让机器能够“思考”。
1、语音合成
语音合成服务主要包括基于讯飞语音云的在线语音合成服务和基于嵌入式引擎的离线语音合成服务。在线语音合成服务运行资源占用小,合成音频具有更高的清晰度、自然度和可懂度,离线语音合成服务不需要依赖网络,能够实时响应。两种均采用先进的文本分析、韵律分析算法和大语料库的合成方法,合成语音已经接近真人的自然效果。
2、语音识别
讯飞语音+提供与说话人无关的智能语音识别技术,来源于科大讯飞国际领先的语言识别引擎,支持连续语音识别和为自助语音服务提供的关键字语音识别、语法识别,具备优秀的识别率,提供全面的开发支持,丰富的工具易于使用,核心技术上达到了国际领先水平。针对语音识别应用中面临的方言口音、背景噪声等问题,科大讯飞在实际业务系统中所收集的涵盖不同方言和不同类型背景噪声的海量语音数据,通过先进的区分性训练方法进行语音建模,使语音识别在复杂应用环境下均有良好的效果表现。
3、语义理解
语义理解技术是整个人机交互的关键技术之一,是让计算机能够按需正确理解人类的自然语言的一项关键技术,具有较高的挑战性。针对语音交互中的语义理解广泛需求,科大讯飞研发了面向业务需求的基于文法规则的语义理解、基于相似问句语义距离度量的知识问答系统,以及基于本体库自动构建及推理的自动问答系统,为各种类型的语义理解需求提供相应的技术支撑。