作者:周璞
此前有报道称,微软正在研发一款原声翻译软件,它能把用户说的话翻译成其他语言播放出来,同时保留用户本身的口音、音色和语调,听上去就像用户亲口 说的一样。近日,微软发布了该软件的最新演示视频,微软首席研究官瑞克拉希德在视频中利用该软件“说”出一口标准的中国普通话。
拉希德表示,该软件的强大翻译能力离不开微软采集的海量数据,而且他在使用该软件之前需要花费1小时对它进行训练,也就是为自己的语音建模。
对于这款软件的核心技术,拉希德透露:“在两年前,微软研究院和多伦多大学的研究人员们取得了一项突破,利用模拟人脑行为的‘深度神经网络’技术,能让语 音识别器更具辨别能力,其性能优于以往的方法。这项技术能让语音识别的错词率比以往的方法降低了30%,也就是说以前是每4.、5个词里有一个不正确的, 而现在每7、8个词里才有1个。”
但是,目前还没有消息透露这个原生翻译软件何时能运用到操作系统中。