12月14日,微软发布了一项新的自定义识别智能服务(Custom Recognition Intelligence Service , CRIS)的私人预览,它是一个高度可定制的工具,可以为应用程序提供类似于Siri的语音转文本功能。这项语音转换文本技术可以直接识别来自麦克风的实时语音,或者是其他来源的实时语音以及从文件内获取的音频。 在任何情况下,都可以通过实时流将语音传送到服务器,服务器再将部分识别结果传送回来。同样在12月14日,微软也开放了两套应用程序接口(API)的公共预览,它给开发者提供了能够理解录音和视频中说话人的技术。
By 张天雷