今年2月,计算所多语言交互技术评测实验室机器翻译课题组参加了由欧盟TC-STAR 项目组织的第三次机器翻译评测,取得了第三名的好成绩。
欧盟TC-STAR项目的评测内容包括语音识别、语音合成和机器翻译,其中机器翻译评测包括汉语到英语,英语到西班牙语,西班牙语到英语三个翻译方向,计算所机器翻译课题组参加的是汉语到英语方向的评测。该方向评测内容是美国之音(VOA)广播稿,具体又分为两个子任务,一个子任务的输入是语音识别软件自动识别的结果(ASR),另一个子任务的输入是人工转写的结果(Verbatim)。
这是计算所机器翻译课题组继去年之后第二次参加TC-STAR机器翻译评测,去年的成绩也是第三名。今年参加汉英机器翻译评测的共有8个单位,比去年增加了2个,其中国内有2家单位参加。经过一年的积累和发展,我们自行开发的机器翻译软件取得了长足的进步。通过使用所里的曙光服务器,我们能够处理更大规模的数据量,与此同时,我们也积极探索新的方法和技术,机器翻译质量较去年有了很大提高。同时,我们也看到,国外的同行们也在不断进步,本次评测的第一名仍然是德国亚琛RWTH大学,第二名是意大利的ITC-IRST研究所。我们与国外同行仍然存在一定差距,需要付出更大的努力去超越。
(文章来源:中国科学院)