翻译数据库问题

Trados 目前还不能自动正确识别同义词和多义词

-  江河水  -

说明
SDL MultiTerm 8(即SDL MultiTerm 2009)原来只是一个术语库管理应用程序,用于帮助创建、管理和显示术语
笔者在此装入了其它数据库文件(包括句库、句型、动词、缩略语、人名地名、公司名、其它机构名),作用已发生了质变,构成了名符其实的翻译数据库,并能使用通配符和主题词搜索,又成了帮助译员克服不熟悉专业问题的知识库。


为了探索它在Trados上应用时的潜能, 作了大量自动搜索术语测试。本测试工作先后在SDL Trados 2007和SDL Trados Stadio 2009上进行。试验前首先将全部(26个)数据库文件(sdltb)装入术语识别选项。自动识别出的术语上面用红线条表示出。在术语识别窗口给出已识别术语的解释。尽管测试结果表明,识别率相当高,但不能自动正确识别同义词和多义词。笔者为了探索其原因,寻找应对措施,作了以下调查研究工作。

一.同义词和多义词是客观存在的事实

在任何语言中都不同程度存在着同一件东西不同叫法,和同一个字或词具有多种不同意思的情况,即存在着同义词和多义词现象。这是客观存在的事实。打开词典,同义词和多义词现象多不胜举。如下例所示。
计算机辅助翻译(CAT)软件在编程时,不能仅仅为了计算机搜索和识别方便,去硬性规定只能一词一义。


 

二.从原文搜索译文时,不管是同义词或者是多义词,识别问题都不大 ,计算机可以提供出全部搜索到的词义,供译者选择时参考。译者可以根据专业、场景、上下文选取合适的词。

1.有许多并列的同义词

如下图所示,每个同义词之间的意义存在着某种程度上的区别。不能,也不应该用其中一个词取代其它的词。因为表述的东西并不完全一样,否则后果是会使语言变得生硬、死板、缺乏活力。
















2.既有同义词,又有多义词

在实际使用中,多为既有同义词,又有多义词。此时绝对不允许用某一个词来代替其它的词。因为不仅仅是词不达义问题了,还会导致张冠李戴的错误。











三.从译文搜索原文时(即反向识别),Trados无法从译文的某个同义词或多义词中自动正确识别出原来的术语。因为计算机此时只有在全部同义词一起出现时才能识别出原始原文中的这个词来。但在实际应用中不可能碰到这种情况。多为某个同义词或多义词单独出现。尽管此时术语上的红线也表示已被识别,但已不是原来的术语。测试中出现了下列三种情况:

1.完全不能识别



2.识别的已不是原始原文术语的意思











3.只有在将全部同义词一起识别时,才能搜索出原始原文的术语。这种情况在实际应用时是不可能出现的





四.结论

尽管在Trados上目前还不能自动正确识别同义词和多义词,但并不等于说不能采用反向自动识别功能,因为还有相当一部分非同义词和多义词可以100%正确识别。对于不能正确识别的这一部分,译者必须有所了解。因为
SDL MultiTerm 2009 是一种以概念为导向的系统。术语库中的每个条目都对应一个概念因此术语库可按任何语言方向搜索,故可以用手动全文搜索有效地解决这个问题。只不过相对麻烦一点。