Google认为,人们未来将能够依靠机器逻辑而非语言学家把文件立即翻译成世界主要语言。
Google的方案名为“统计机器翻译”(statistical machine translation),这与以往的努力不同。
以往人们都是把语言学家设置的语法规则和词典输入电脑。
Google将把人们已经翻译的文件输入电脑,然后依靠电脑来识别未来如何翻译。负责该项目的Franz Och表示,尽管质量还不完美,比以往的机器翻译已经有所进步。他说:“一些长期从事机器翻译的人看到我们将阿拉伯语翻译成英语的文字后表示,这是一大突破。没有用过机器翻译的人读译文后说,第一个错误在第五行。”
对于绝大多数任务而言,基本正确的翻译已经足够好了。将阿拉伯语新闻网站翻译为英语已经做得不错,但是两名Google员工表示,将英语网站翻译为俄罗斯语还有些蹩脚。Och输入的文字主要是联合国文件和欧盟文件。没有大量翻译文字的语言将面临较大的问题,如非洲语言。Och说:“输入得越多,翻译得越好。”
到目前为止,Google在http://www.google.com/language_tools提供阿拉伯语、中文和俄罗斯语的统计机器翻译功能,利用第三方软件能获得德语等文字的翻译。Och表示:“到目前为止,重点一直是做出很好的译文。根据Google的哲学理念,一旦有用就会有影响,到时候就能找出来赚钱的方法。”
爱丁堡大学教授迈尔斯-奥斯布恩与Google在该项目上进行合作,他说,对于阿拉伯语英语这样的组合,该项目可能有很好的表现,但是,软件在专家级别的翻译上不会超过人。
Google董事会主席施米特表示:“如果我们能同时翻译100种语言会是什么样子?Google等一些公司正在研究统计机器翻译,这样,我们就能随时翻译一切。”