7*24小时服务热线:0755-23994502 邮箱:info@transphant.com(业务咨询、资源合作) / careers@transphant.com(简历投递)
简体中文
  • 简体中文
  • 繁体中文
  • English
  • Japanese
  • Korean
  • Russian
  • French
  • Spanish

MT和CAT翻译方式的比较及选择

2021-11-09 00:00:00


互联网的飞速发展极大地丰富了翻译方式,带动了全球翻译市场的繁荣。为了节约成本,提高翻译效率,译员纷纷借助于现代网络技术及工具来辅助完成翻译任务,出现了众多新颖的翻译方式。其中尤其以MT(Machine Translation,机器翻译)和CAT(Computer - Aided Translation,计算机辅助翻译)两种翻译方式使用最广、接受度最高。有鉴于此,文章详细描述这两种翻译方式的发展演变及工作原理,指出其异同及优缺点,从而帮助译员在翻译实践中选择适合自己的翻译方式。


一、两种主要翻译方式概述

(一)机器翻译概述

机器翻译,顾名思义就是指通过机器将一种语言形式自动转换为另一种语言形式的过程。在整个语言转换过程中,机器始终是语言转换的直接参与者或参与主体,是译文生成的核心形式。

根据不同发展阶段所呈现出的不同特征,机器翻译主要可以划分为基于语言规则的翻译和基于语料库的翻译两种形式,其翻译特点及具体流程如下所述。

1.基于语言规则的机器翻译

任何一种语言都有自己独特的诸如语音、词汇、句法、语义等系统。在这些系统的协调作用下,语言的交流功能得以成功实现。20 世纪后半期,随着计算机技术和现代语言学特别是乔姆斯基的转换生成语法理论的日益发展,语言学家开始尝试着将语言学与计算机技术相结合,编制出一套公式化、规则化的语言结构模型,尝试着用规则去描述语言进而翻译语言以实现不同语言间的转换,即基于语言规则的机器翻译。

基于语言规则的机器翻译的工作原理为:计算机软件将输入的原语文本通过词法、句法、语法、语义等分析转换生成为计算机系统内储存的中间语言结构模型,再经由中间语言结构模型转换生成为另一种语言即目标语言,从而实现不同语言间的近乎等值的转换。这类机器翻译主要集中在词典类查阅翻译软件方面。代表性的以双语词典类软件为主,主要有:金山词霸、巴比伦翻译家、金山快译、东方快车、南极星、通译、雅信译霸等等。

2.基于语料库的机器翻译

互联网技术的日趋普及以及全球国家间经济与文化交流的深入,为了促进行业间专业化国际化交流,大量不同领域专业文献资料亟待翻译,为了系统高效地完成翻译任务,诸如机械、电子商务、法律、汽车制造、生物医学等不同领域不同行业的双语或多语种语料库应运而生。海量的资源以语料库的形式被保存于互联网平台供译员使用,尤其是一些专业化程度高、普及度广的双语平行语料库,更为不同语言间的转换提供了便利。

双语平行语料库基于 SGML标记语言对采集到的流通中的真实动态语料通过 TEI 和 CES 文本编码,以词、短语及句子为单位进行自动对齐排列,译员实际翻译中对有疑问或不懂的地方,只需打开相关的语料库平台直接输人原语文本中的词频或句频进行搜索,就会得到基于统计和实例的鲜活目标语文本语料,极大地提高了翻译效率,成为翻译过程中的“机器译员”。国内外知名的语料库主要有:北京大学中国语言学研究中心开发研制的“汉英双语语料库”、北京语言大学高翻学院开发研制的“高翻记忆库”、上海交通大学语言工程研究所的四个语料库、国家语言文字应用研究所开发研制的“计算机专业双语语料库”等。一些基于网络平台的在线翻译工具诸如 Google 在线翻译、百度在线翻译等正是利用网络大数据语料库平台,为广大译员提供质量上乘而又便捷高效的翻译,在众多基于网络语料库的机器翻译工具中脱颖而出。

机器翻译无论是基于语言规则还是基于语料库的翻译形式,其翻译过程都可以归纳为分解、转换及合成三个步骤。分解阶段,系统根据提交的原语词汇或句子,检索匹配系统中储存的语言结构模型或实例,形成原语匹配表达;转换阶段,机器根据系统中的对齐功能将原语匹配表达转换成目标语匹配表达;合成阶段,将目标匹配表达融合到目标语全文文本中,输出目标译文。

(二)计算机辅助翻译概述

机器翻译较于人工翻译费时低效带来了翻译效率的极大提升,但是由于其糟糕的翻译质量,到了20 世纪80年代进入了“反思的理性阶段”。德国翻译理论家认为技术的产物,无论怎么复杂,都不能和人脑的创造能力相媲美。20 世纪 80 年代末,随着计算机技术革命浪潮的蓬勃发展以及网络平台大数据资源库的日益完善,一种新型的基于记忆库和术语库的计算机辅助翻译形式应运而生。广义的计算机辅助翻译概念是指,能够辅助译员进行翻译的所有计算机工具,包括文字处理软件、语法检查工具、电子邮件和互联网等。也就是上文所提到的机器翻译。狭义的计算机辅助翻译概念是指“为提高翻译效率,优化翻译流程而设计的专门的计算机辅助翻译软件”。主要包含翻译记忆工具、术语管理工具等。其中以中国的雅信 CAT、法国的 DejaVu、德国的 Trados 等为典型的代表。

1.翻译术语库模块及其功能

术语库管理模块,可以转换、编辑及生成项目术语库。确保译文术语前后的统一性。通过译前导入客户所提供的术语资料或译前翻译公司及译员整理的术语资料,系统将导入的术语信息编辑并自动保存到后台术语库,在后面的翻译过程中系统自动从后台调取供译员使用。

2.翻译记忆库模块及其功能

翻译记忆模块作为计算机辅助翻译软件的核心模块,是“译者运用计算机程序部分参与翻译过程的一种翻译策略”。其工作的原理是:“译员利用已有的原文和译文,建立起一个或多个翻译记忆库,在翻译过程中,系统将自动搜索翻译记忆库中相同或相似的翻译资源(如短语、句子、段落等),然后给出参考译文供译员选择,对于给出的参考译文,译员可以完全照搬,也可以修改后使用,如果觉得不满意,还可以弃之不用。这样译员就可以避免无谓的重复劳动,专注于新内容的翻译。而翻译记忆库司时在后台不断学习并自动储存新的译文,变得越来越聪明,效率越来越高。”


二、两种翻译方式的比较及翻译选择

机器翻译与计算机辅助翻译两者既有联系又有区别,不能混为一谈。机器翻译是计算机程序自动参与翻译全过程并直接生成目标译文;而计算机辅助翻译,程序本身并不直接参与翻译,并不能直接生成目标译文,只是辅助人工提高效率。机器翻译与计算机辅助翻译作为“互联网 +”时代影响较广的两种翻译方式,各有其优劣之处。译员在翻译时,应根据所需,扬长避短、趋利避害,选择适合自己的翻译方式。两者的优劣分析如下。

(一)MT和 CAT的优势比较分析

不论是机器翻译还是计算机辅助翻译,较于之前的人工翻译,速度快、成本低,都从根本上减轻了译员的负担,提高了翻译的效率。

机器翻译由于系统自身储存的数以万计的词汇、庞大的中间语言结构模型库及大量分门别类的多语种平行语料库,可以快速地实现原语与目标语之间的转换,提高翻译效率。

计算机辅助翻译由于系统自身携带的术语库与记忆库,可以在翻译进行中自动为译员从储存库中检索匹配相似词段及句段供译员选择使用,确保译文前后表达的一致,减少了译员单调重复的机械劳动。计算机辅助软件本身还兼容市面上众多格式的文本并生成与原语文本格式相同的目标文本,省去了专门技术译员进行排版及格式转换等工作,降低了翻译的成本。符合翻译流程管理本地化节省开支的要求,从而有效地提高了翻译效率。同时这种以人工为主机器为辅的人机交互翻译模式,集合人工与机器的优点,在一定程度上避免了以机器为主体自动翻译模式的弊端,进一步提升了译文的质量。

(二)MT和CAT的劣势比较分析

机器翻译快速便捷,翻译的前提是必须有大量的概率化的语言结构模型及基于鲜活实例的语料库供计算机系统进行检索匹配,从而进行编码解码生成目标译文。语言结构模型模拟人类真实语言规律,通过一定的规则来描述自然语言。尽管计算机具有储存记忆等功能,但是人类自然语言具有灵活性、复杂性、变化性及开放性等特点,计算机需要识别原语的形态,进行形态分析、语义分析以及句法分析,这就使得中间语言结构模型的构建变得异常困难。王金铨认为,翻译过程不是一个简单的语码转换过程,而是一个极其复杂的心理过程,是一个非线性的波浪式前进的动态思维过程。尤其是随着“互联网+”大数据时代的到来,翻译的信息量更加庞大,从而一定程度上进一步加深了中间语言结构模型构建的难度。这就导致了基于语言规则的机器翻译生成的所谓“草稿译文”质量令人忧虑。而基于语料库的机器翻译由于鲜活语料的帮助相对于基于语言规则的翻译就相对容易许多,译文的质量更有保障。但是众所众知,平行语料库的建构不是一朝一夕一蹴而就的简单事情,另外网络数据平台储存的鲜活实例需要耗费大量的人力物力进行筛选整理去粗取精去伪存真。

计算机辅助翻译充分发挥人工的主体性及能动性以及机器的存储性与记忆性的特点,在语料库机器翻译的基础上又往前推进了一步。但是作为计辅翻译的核心组件,术语库与记忆库的构建同样也任重道远。记忆库的质量控制、成本维护、开源与封闭、知识产权归属等也时刻制约着计算机辅助翻译的广泛与长远的发展。

翻译活动的复杂性决定了译员不可能仅单纯地依靠某一种翻译方式就能完成翻译任务,而是需要综合使用多种翻译方式,优势互补,扬长避短,共同作用于翻译实践。

随着“互联网+”大数据时代的不断发展,需要翻译的文献资料数量日趋庞大,对翻译方式的选择也愈来愈频繁,选择什么样的翻译方式来进行翻译是每个译员急需解决的问题。希望译员在本文的帮助下,综合考量所要使用翻译方式的特点及所翻译的源文本类型特点来选择合适的翻译方式,最大化发挥各种翻译方式的优势,从而提高翻译效率。


文章来源:网络