您的位置:首页 > 其它

专业翻译领域的首选技术--翻译记忆

2012-11-20 17:53 295 查看
国内专业翻译们在用什么工具

  纵观当前国内翻译软件市场,今天一"星",明日一"霸",群雄并起,竞争激烈。仔细分析这些产品之后,我们可以将其分为两大类:电子辞典和机器翻译。

  电子辞典的优点自不待言,对词的翻译准确而且快速,但在专业翻译领域,电子辞典所能做的毕竟十分有限。

  这两年对中国机器翻译界来说,是高速发展的两年。仿佛就在一夜间,各厂家便推出了各自的机器翻译软件产品。据称译文的可读性最高达到70%以上(注 意,是可读性,而不是准确性!)。丰富多彩的软件广告,令人神往的应用前景,形成了国内软件市场一道独特的风景。然而相对于这边的热闹场面,在最需要翻译 软件的专业翻译领域,却是波澜不起,一切依旧。进入国内任何一家翻译公司或是大公司的本地化/翻译部门,所有翻译工作仍然停留在手工作坊阶段,要说现代 化,最多也就是在电脑里安一本电子辞典,再就是利用电脑做文字录入工作。是翻译领域不需要翻译软件吗?恰恰相反,专业翻译人员最能体会到日复一日伏案翻译 的艰辛,对翻译工具的需求也最为迫切。问题在于即使是70%的可读性,对于视质量为生命的专业翻译来说,还是难以满足要求。此外目前机器翻译软件对电子文 档的格式处理能力有限,这又将近年来迅速崛起的专业翻译领域的重要分支--本地化行业的需求挡在门外。

  现在让我们来回答标题所提出的问题,答案很简单:国内专业翻译领域没用任何工具!

  国外专业翻译领域在用什么

  在一年一度的全球LISA大会(Localization Industry Standard Association,本地化工业标准协会)上,MT和TM是永恒的话题。MT就是机器翻译(Machine Translation)的缩写,那TM又是什么呢?它是Translation Memory,中文译作"翻译记忆"。

  国内读者可能还不太了解,其实目前TM技术几乎独霸国外专业翻译和本地化市场。企业一旦决定在工作流程中采用翻译软件,首先考虑的就是TM,要决定的 也就是选用哪种TM产品。事实上,不仅IBM、微软、ORACLE、SAP等IT公司和Bowne Global(宝捷环球)、LionBridge、Berlize等本地化公司和翻译公司在大量使用TM产品,欧盟、国际货币基金组织、沃尔沃、大众汽车 等国际组织和企业也都是TM的忠实用户。

  反观每年LISA大会上,翻译记忆(TM)厂家的展位一字排开,气势非凡,而人们却很难在会场找到机器翻译产品的踪影。有关翻译软件的讨论,也大都集中在翻译记忆领域。国内有些广告做得风风火火的翻译软件公司,甚至不知道有LISA这个组织,个中原因,实在耐人寻味。

  什么是翻译记忆

  1.原理

  翻译记忆(TM)的原理其实非常简单。由于专业翻译领域所涉及的翻译资料数量巨大,而范围相对狭窄,集中于某个或某几个专业,如政治、经济、军事、航 天、计算机、通讯等专业都有自己的专业翻译公司或部门。这就必然带来翻译资料的不同程度的重复。据统计,在不同行业和部门,这种资料的重复率达到 20%~70%不等。这就意味着译者至少有20%以上的工作是无谓的重复劳动。翻译记忆技术就是从这里着手,首先致力于消除译者的重复劳动,从而提高工作 效率。

  翻译记忆(TM)技术原理是这样的:用户利用已有的原文和译文,建立起一个或多个翻译记忆库(Translation Memory),在翻译过程中,系统将自动搜索翻译记忆库中相同或相似的翻译资源(如句子、段落),给出参考译文,使用户避免无谓的重复劳动,只需专注于 新内容的翻译。翻译记忆库同时在后台不断学习和自动储存新的译文,变得越来越"聪明",效率越来越高。几乎所有翻译记忆厂家都会告诉用户:有了TM,你永 远不必对同一句话翻译两遍!

  机器翻译界一位著名专家曾经说过,机器翻译做了人愿意做的工作,却没有做好;翻译记忆则做了人不愿做的工作!可不是吗,有谁愿意把时间花在重复劳动 上,又有谁乐意让一台技术不成熟机器来代替自己的工作呢?翻译记忆技术,实际起了辅助翻译的作用,也就是"计算机辅助翻译",简称 CAT(Computer Aided Translation)。

  2.功能与实例

  1) 翻译过程

  我们来看一个典型的翻译记忆软件工作的例子。启动TM系统来翻译句子"This is a file for demo."。由于这是TM第一启动,当然没有任何"记忆",需要用户输入译文:"这是个演示用的文件"。TM在翻译下一句的同时,也把这一原文和译文做 为一个翻译单元储 存了起来。当我们再来翻译另一个句子"This is a demo file."时,TM会搜索翻译记忆库,对该句和记忆库中翻译单元进行对比和匹配,挑出原文最接近的翻译单元,给出参考译文。在这里,该参考译文就是"这 是个演示用的文件。"用户当然可以接受该译文,也可以做一些修改,修改后的新译文会自动存入记忆库,供以后使用。翻译记忆库就这样储存每一句新的译文,随 时为用户提供参考。由于专业领域词汇和句式相对固定,当用户积累了多个有一定规模的记忆库后,遇到的重复句子会越来越多,翻译工作也变得越来越轻松。

  TM产品还都支持网络共享记忆库功能。也就是说,当多人同时进行翻译时,可以通过局域网共享一个翻译记忆库。比如,译员A刚刚翻译了"This is a file for demo.",当译员B遇到"This is a demo file."时,系统会给出A的译文"这是个演示用的文件。"。B可以接受,也可以修改,修改后的译文又可供自己或他人重复使用。翻译记忆库就在这样的不 断补充和完善过程中,发挥着越来越大的作用。

  2) 自动建库

  对于在使用TM产品前,已经积累了大量翻译资料的用户,TM产品会提供一个自动建库工具。该工具能自动分析和匹配原文和译文,以句子为单位将原文和译 文一一对应。用户做完一些调整和校对之后,该工具会自动生成一个标准的翻译记忆库文件。用户所有的资料都可以通过该工具得到回收,从而高效、快捷地建立起 翻译记忆库。这些库在不断的使用过程中,又会得到进一步补充和完善。

  3)术语管理

  TM产品一般还提供一个非常重要的功能:术语管理。对于专业技术领域来说,几乎每篇文档都带有大量的专业术语,术语译文的前后一致,始终是校对的重要 内容之一。这项工作费时费力,难保还会有疏漏。TM产品通过一个术语管理工具(一般是个电子辞典),来规范所有的术语。用户只需一次性建立一个或多个标准 术语列表(表中包括术语原文和译文),在使用TM系统翻译时,打开术语管理工具中相应的术语列表,TM会自动识别出当前句子中有哪些词是已定义的术语,并 给出标准的术语译文。这样就不会在一篇文章或一本书中,不同的人把"Mouse"分别译为"鼠标"、"滑鼠",甚至"老鼠"了,也省掉了校对的麻烦。不同 的TM产品对术语管理的实现方式虽有不同,但殊途同归,最终都是为了保证术语的统一。

  4) 多语种间双向互译

  由于翻译记忆实现的是原文和译文的比较和匹配,这还带来了TM的一个先天优势--支持多语种之间的双向互译。以全球最著名的翻译记忆软件厂商,德国塔多思(TRADOS)公司为例,该公司的产品基于UNICODE,支持55种语言,覆盖了几乎所有语言版本的Windows 95/98/NT。换句话说,一套产品就可以实现各语种间的双向互译,这在机器翻译是难以想像的。

  5) 自动排版

  人不愿做的事情又岂止是重复劳动。电子文档的排版工作也是让翻译人员头疼的工作。尤其本地化行业,对译文的格式要求极为严格,必须和原文档的格式保持 一致。在这方面,翻译记忆产品又远远地走在了前头。目前的翻译记忆产品一般都提供各种格式处理工具,支持流行文档格式,如DOC、RTF、HTML、 SGML、PPT等等。译文会自动套用原文的格式,翻译人员不必费心排版,只要全神贯注从事翻译就可以了。

  统计数据表明,通过在翻译流程中应用TM技术,工作效率能提高30%~60%,效益十分可观。

  6)项目管理

  翻译软件市场,谁主沉浮

  答案似乎不言自明,难道不是翻译记忆吗?其实翻译记忆的技术特点决定了它的用户群主要是专业和行业用户。对外语水平较差的个人用户来说,机器翻译的译 文尽管还"不太明白",但总比"一点都不明白"要好得多了。而翻译记忆产品昂贵的价格,日复一日的翻译记忆库建立工作,都是非专业用户所无法承受的。所以 在现阶段,TM和MT各有所需,各得其所,倒也相安无事。

  目前在全球翻译记忆(TM)市场上,有德国塔多思(TRADOS)处于绝对领先地位,其核心产品Translator's Workbench(翻译工作平台)直接和微软Word集成,界面友好,此外还有强大的网络共享、术语管理、翻译项目管理,以及格式转换处理功能,为专业 翻译领域提供了一整套解决方案。

  随着TM这一技术在国内的推广应用,人们必然面临一个选择的问题。其实只要做到了以下几点,就可以说是真正的TM产品:第一,支持TMX(Translation Memory eXchange,翻译记忆交换)标准。因为只有翻译记忆库文件的输出格式符合TMX标准,才能实现不同TM产品间的数据交换。第二,支持多语种之间的双 向互译。第三,开放的翻译记忆库管理机制,允许用户根据需要,对记忆库进行分类、检索、合并、拆分及加密。第四,支持多种常用文档格式(DOC、RTF、 HTML、SGML、PPT、FM、MIF等),避免用户再排版。第五,提供术语管理功能,即通过统一的术语列表,在翻译过程中动态提示术语的译文,规范 术语的翻译。如果您所面对的TM产品完全符合这些条件,那就值得进一步评估。至于其它功能,当然多多益善,但以上几条是必需的。

  对于专业翻译领域来说,翻译记忆(TM)是目前唯一的选择。该领域特点决定了翻译记忆技术有着广阔的应用前景!

  小资料:

  1.本地化行业:严格的说,本地化行业应该属于IT业,因为它的业务范围包括了软件内核的本地化和文档的本地化等多个方面。即使是文档的本地化,也因有严格的格式要求,对电脑排版的要求极高。

  2.翻译单元:TM的基本单元是句子。其实TM可以按照用户定义的断句标准,储存词组、句子,乃至段落作为基本的翻译单元。因为句子的重复性更高,更适合实际情况,所以TM产品都以句子为单位。

  3.Unicode:统一字符编码标准。基于Unicode技术的软件产品能支持任何语言编码。

  4.TMX:Translation Memory eXchange,翻译记忆交换标准。实际上,TMX也是一种标记语言,以文本文件的形式保存(和HTML类似),TM产品可以导入用TMX格式编写的文件,建立翻译记忆库。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: