微软中国研究院昨天透露,该院致力于新一代自然语言处理技术,特别是中文信息处理的研究,并且在机器辅助翻译领域取得了重大突破,这将给不谙英语者上网带来福音。
据介绍,该项技术不仅局限于单字或单词的翻译,而是准确地提供短语级译文。它甚至可以对文本进行总结,给出摘要和近似的翻译,从而使用户不需要阅读、翻译整篇文章便可以了解大概内容。
微软中国研究院自然语言组负责人、主任研究员黄昌宁教授指出,面对因特网上百分之九十九的外文,大多数中国用户都感到无从下手,语言障碍成为他们使用计算机和应用网络资源的最大问题。但该项技术的实现使完全不懂英语的人也可以轻松快捷地浏览大量的英文信息。对于具备一定英文基础的使用者,该技术能有效地帮助他们发现并改正写作中的语法错误,同时,系统自动提供的范文及例句也能帮助作者润色文章,拓展写作思路。
另外,在中文校对系统方面,自然语言组也实现了技术上的重要进展,他们提出了“全局求优的语言模型”,针对每个输入的汉字进行混淆级扩展识别,分辨出错误的输入,并自动进行修改。