译网
语言行业资讯

2030年翻译机真能突破语言障碍?

西方圣经上说,挪亚的子孙人口众多,遍布天下,且只讲一种语言。人们齐心协力用土坯砖和黑沥青建造“通天塔”,上帝极不高兴,就让他们说不同的语言。由于突然之间大家语言不通,彼此无法交流和理解,工程不得不停止了,这座未完成的塔就叫“巴别塔”。从此以后,人类就一直在找寻沟通的途径。

  先是翻译、再是世界语,直到目前的机器翻译,甚至还有人提出随着语言的逐渐消融,最终回归到人类造“通天塔”之前的原初状态,说同一种语言。无论是哪种方式,人类是否真的能改变上帝的意旨,彻底扫除人类之间的语言障碍呢?

科学家:“三五十年内,我们将为人类扫除语言障碍”

  目前,随着中国加入国际语音翻译协会项目,“语言翻译”前景看好,似乎在不久的将来能为人类扫清语言障碍。据中科院自动化所模式识别国家重点实验室研究员徐波介绍,C-starⅢ项目将从2001年正式启动,到2004年结束。其目标是利用公共电话网络和国际互联网,在四年内实现通过手机、电话、计算机终端等设备进行不同语种人类之间在旅行期间的同声场景对话,包括预定旅馆、购买机票、餐馆对话、外币兑换等,更重要的是该项目把多国语音的直接翻译作为一个科学工程!通过建立系统性的平台、演示而推动该技术的迅速发展,在30至50年内最终达到彻底扫除人类之间的语言障碍。

  据中科院声学所专门研究语音交互技术的杜利民博士介绍,中国着手研究语音翻译系统已有两年的历史。七国语音同声互译的原理是,先将本族语识别后翻译成中间语言,再用中间语言与其他语言互译。但目前国际语音互译计划的词汇量仅限于10000个字词,对话场景也仅仅初步定为预定旅馆、购机票、餐馆对话、外币兑换等场所。

  纵然如此,在技术上进行直接语音翻译仍有很大的挑战性。徐波介绍说,直接语音翻译集语音识别、机器翻译和语音合成于一体。首先是语音识别,尽管目前实验室里的语言识别率已达90%以上,但由于现实生活中的口音、方言、背景噪声等一系列因素,识别率仅为60%左右,还需我们在近几年内有进一步突破。

  其次是机器翻译,由于不规范的文本以及各种语言的自身特点,如汉语的非时态,句子的歧义等增加了翻译的难度,而最难的是把两者合在一起,即语音合成。目前除上述七国之外,许多国家都在进行这方面的研究,国内如IBM等公司,也一直在做相关研究,而日本的研究,几十年来一直就没有停止过。

  况且,现在新的方法比较多,如语意法、实例法、模板法以及统计法等。对于像“Howdoyoudo?”一类的句子,对其进行语法分析,怎么都分析不通,但用实例法像公理一样把它规定下来,就简单多了。今后若能有更多更好的方法并能把这些方法结合起来,语音翻译势必有很大突破,而且不久就会有突破。徐波描述了三五十年后的诱人场景:对于不用对外国进行学术研究的人,将不必每天疲于学外语、过级,不必有很多翻译,即使联合国开会时也一样,只需每人带上一副小巧精致的同声自动语言翻译机器,就可实现与任何其他语种的人进行自由交流。

  徐波说,“我们的目标就是想通过纯技术的力量经过哪怕几十年努力,把人类彻底从语言障碍中解脱出来”。

  微软中国有限公司周明说:“语音翻译系统之所以难攻克,是因为牵涉到了千变万化的自然语言,但自然语言也不过很复杂而已,总有一天,或许要不了多久,人类终将会攻克它。”

学者:对能否违背“上帝的意旨”表示怀疑

  即使发明了更高级的语音翻译机,就可以彻底扫除人类的语言障碍吗?专家们有不同的看法。

  北京语言文化大学计算机系主任、对外汉语研究中心教授宋柔告诉记者,语音翻译系统的研制对一部分只需浅层交流的人们很有意义,如果研制成功并达到相对完美的情况下,将会解脱出一批疲于外语学习的人们,但却无法彻底解决人类的交流问题。不同民族的思维对概念的切分是不同的,比如英语中的“uncle”,在汉语中就分为“伯伯”、“叔叔”和“舅舅”,英语中可对每个人都称“dear”,在汉语中就不能乱叫。而汉语中的“仁仪礼智信”无论翻译成哪种语言,都不大好对应。语音翻译归根结底仍是机器翻译,无论是对字词的把握,还是对微妙的感情色彩的处理,都不可能达到百分之百的准确。

  中国中文信息学会常务理事董振东说,语音翻译离不开机器翻译作支持。而目前机译与人译的最大区别是,机译只是句法结构和词汇的机械对应,而人译则会基于他对源语言意义上的理解,不受源语言句法结构的束缚,是一个再创造的过程。如果在本世纪机器翻译能够在以下三个方面有所突破:

  第一,大语境,而不再是一个句子一个句子孤立地处理。

  第二,基于理解而不再是停留在句法分析的层次上。

  第三,高度专业化、专门化,而不再是“万事通,样样松”。

  语言学教授崔希亮则从另一个角度谈到:

  语言从大的方面分可大致分为四个不同的类型:一是孤立语,如汉语;二是曲折语,如英、法、俄、拉丁等语;三是粘着语,如日语、蒙古语;四是编插语,如太平洋等地的某些语言。尤其是编插语,与其他类型的语言差别最大,句子里根本就没有“词”这个概念,或者说一个“词”就是一句话,这是一种整体语言。对于同一句话,只需要改变其中的1个或某几个音素,就变成了完全不同的另一个意思。像这种语言,要完成与其他语种之间的语音翻译,难度可想而知。但如果七国电话语音同声自动翻译计划顺利完成,肯定会对其他语种的同声翻译起到促进作用,甚至许多问题都能迎刃而解。

语言“大同”人类方能沟通?

  既然人类一直在寻求沟通的途径,是否可以通过世界语或语言的自然消融而实现人类的最终无障碍沟通呢?社科院语言研究所研究员方梅介绍说,事实上,1881年波兰人柴门霍夫就发明了世界语,试图用它来实现人类的自由交流,但100多年来,世界语并没有市场。另一方面,世界上的语言总体上在逐渐减少,由以前的6000多种减至今天的5000种左右,但最后消失到一至几种语言,可能性不太大,即使可能,也需要很长时间。语言作为一种传统的东西是有根基和背景的,不会一下子被打破。

  语言学教授崔希亮则表示,语言的发展有分有合,要消除至少几种语言来实现交流,短时期内不可能。语言与政治、经济、军事、文化等原因息息相关。同一个民族,若分隔得时间长了,就变成了两种语言,不同的民族若融合的时间长了,就变成了同一种语言,如满语与汉语融合后,满语就消失了,这都是政治或政策的原因;再如英语,凡曾是被英国殖民的地方都说英语,但又有所变异。这是经济原因和军事原因所造成的。

  据专家介绍,每个民族都认为自己的语言是最丰富最优秀的,他们都会竭力保护自己的民族语言,像新加坡,一个还没有海淀区大的国家,就有五种语,包括英语、华语、马来语、印地语和泰尼尔语。有五种语言的出版物、广播、电视和宗教场所以及学校等,他们的工作语言是英语,但很少有人只会说一种语言,若只会一种语言,尤其是只会说英语则很难融进任何一个组织。因此,要靠语种的消失来突破人类的语言障碍,不是没有可能性,但是需要极其漫长的过程。

  人大社会学系博导教授周孝正则认为,语音翻译系统与语言的消亡本身就是一个对立的问题,若语音翻译系统比较完善,能满足一般人的沟通和交流,人们将会越来越依赖于这种机器,不再去用心学外语,而只说本族语言,这样无形中又促进了各民族自身语言的发展,延缓了语言的消融速度。同样,语言消融速度的减慢,更增添了人类在不依赖于机器下的自然语言的交流难度。因此,要真正突破人类语言的障碍,并不是一件很轻易的事。

几千年前,人沟通障碍能从这块古石碑(如图)看出,这是埃及法老托勒密五世的一道诏令,上有古埃及象形文、通俗文、古希腊文三种不同语言。法国学者对比后破译了天书般的象形文,发现象形文也有标音作用,有些符号发音,有些不发音。图中法老“托勒密”和埃及艳后“克丽欧佩脱拉”的名字写法截然不同。 (北京青年报 陈蘅)

未经允许不得转载:『译网』 » 2030年翻译机真能突破语言障碍?