[图]Google Cloud的文本转语音/语音转文本API获重大更新

2018年9月1日 | By News | Filed in: News.

https://ift.tt/2BWPBl3


Google Cloud的文本转语音(Text-to-Speech)和语音转文字(Speech-to-Text)两个API在今天获得的重磅更新中,引入了对更多语言的支持,会更容易从不同扬声器上听取自动生成的声音,并承诺为语音识别提供改进版工具来提供更好转换效果。在本轮更新中,Cloud Text-to-Speech API也正式向用户开放。

对于很多开发者来说,本轮更新最为重要的就是发布了17种基于WaveNet的新语音。WaveNet是Google利用机器学习来创建文本转语音音频文件的技术。在升级之后能够带来更自然的声音体验。在本轮更新中,文本转语音API中新增了14种语言和相关变体,提供了总计30种标准语音和26种WaveNet语音。

在语音转文本方面,Google让开发者更方便的转录多个扬声器上的样本。使用机器学习,这项服务能够识别多个不同扬声器上的语音(不过之前依然需要告知机器会有多少个扬声器样本),然后对扬声器进行编号。同样新版中支持多种语言,开发者最多能够选择四种语言,语音转文本API会自动识别当前设备使用哪种语言。

IT.数码

via cnBeta.COM http://www.cnbeta.com

August 29, 2018 at 09:37AM


发表评论

电子邮件地址不会被公开。 必填项已用*标注