编者多年来在CAT中的实践

 

 

 

 

 

 

 

 

论主动建立专业翻译记忆库(句库)问题
-江河水
  

 

引言
 
 
笔者根据自已的亲身体验,建议用户在使用Trados的整个过程中,应高度重视主动建立并不断维护和增补专业词库和句库的工作。这里的“主动”是指用户 按照自已所从事的和熟悉的的专业,根据本身需要,将自已过去收集的、词典和书本上现成的、得到业界认可已约成俗定的的术语和和合符语言规范 ,即遵守语法规则和口语或书面语言习惯的例句,用一定的工具或方法,主动建立专业词库和句库。“被动”建库,是指一切随自然。单靠自身用TWB翻译,一句一句慢慢积累 或企图依赖所谓网络资源,把一切希望寄托在目前并不非常靠谱,有点虚无飘渺的网络上。将MultiTerm只用来规范个别客户所提供的少得可憐的专业术语 。“被动”建库的缺点是周期长;由于受译员本身水平高低不等和专业限制,使用的术语和译文未必是经典的和规范的。产生这样和那样的错误是难免的。 用这样的术语和例句构成词库和句库,以错指导后面的翻译,后果是可想而知的事。当然主动建库并不容易,但这是工作的需要,是专业翻译技术创新的迫切需要。笔者经验说明,依靠自已长期坚持努力,作好这件事也是有可能的。本文只讨论主动建立专业翻译记忆库(句库)问题,谈谈个人在长期建库实践中的一些感受。

一.建翻译记忆库(句库)前的准备工作

1.资料准备

1)收集和整理自已从使用Trados翻译以来所有尚保存的双语文件,包括直接在word中翻译的保留双语的doc文件和利用Tageditor翻译的ttx文件。我认识句库重要性有一个过程。开始几年也处于“被动”建库状态,有部分文件未保存好,找不到了 。

2)将自已多年来从专业词典和德语教科书中摘录的例句汇编成表格(excel文件) 。

3)从网上收集建库的方法和学习别人建库的经验。作到心中有数。

2.设备准备

几年前,为配合专业词库的使用,更新了一台笔记本电脑。采用AMDAthlon(tm)II P340/2.20GHz 双核处理器,4G DDR2内存。在查术语时,我已成功地作过调入70万词条,同时查找多达30个术语的试验。由于在实际使用中发现,这样的硬件构架,还不能充分满足句库和大型词库的要求,也难以适应三屏显示的需要。今年初,又新配置了一台台式计算机。具体配置如下:主板:技嘉GA-880G-VD3HCPUAmdX6 1055T;内存:海盗船  1600 2G X 2;硬盘:ST 1TB;电源:安钛克 VP450P;液晶显示屏:优派VA2232W 三只;显卡:蓝宝石  6850。 这台计算机因采用了AMD公司的六核,多线程的CPU,加上主板、内存和电源性能稳定,已成功的完成了一次调入三十个词库文件(计120万词条)同时查找50多个专业术语的试验,并能从句库中已建立的38000多例句中快速与待译原文中相同或类似句子对号入座,自动上屏。总而言之,计算机一定要速度快,多核多线程的处理器,内存尽可能要大一些。否则应用会受到一定影响或根本无法使用。

3.软件准备

主要是选择合适的Trados版本和采用相应的操作系统
如果你的软件是Trados 9.0,可采用64位的操作系统,我用的是Trados 7.5, 64位操作系统不兼容,故只能用win7 32位系统。

二.建翻译记忆库(句库)的方法 

1. 一般通用的方法,

1)用Excel制作TM

打开制作句库的Excel表,如图1所示:A列是德文原文,B列是简体中文的译文。在单元格C1中输入
="<TrU>"&"<SegL=GE-GE>"&A1&"<SegL=ZH-CN>"&B1&"</TrU>"按回车。

 
 
                       图1   

C列其他单元格中复制公式。(方法为:选中C1,右键菜单中选择复制,选中C列,右键菜单中选择选择性粘贴,在对话框中选择粘贴公式。选中C列,将C列内容复制到记事本中,保存为txt文件(图2)。



图2 

打开TM,导入刚才保存的txt文件即可。(注意,只能以新建方式,即独占方式打开的TM才能导入)

2)用WINALIGN制作TM句库

 必须把双语分成两份文件,分别输入 WINALIGN,手工一句一句对齐,我感到这种方法比较麻烦。据说网上介绍有简化的办法。    

2. 笔者采用的方法

1)直接用双语文件制作TM句库法

将用word翻译的双语doc文件或Tageditor翻译的ttx文件加入TWB上自动翻译一遍,便可自动生成TM句库。优点是它不要求独占方式打开TM,即可以在一个TM中反反复复地增补TM句库,便于管理和使用。缺点是Tageditor中的标识符容易造成句子中断。此外由于它是由许多双语文件导入生成的,可能重复会特别多。所以在自动翻译时,应正确选择有关选项(图3)。即在“Unbekannte Sätze segmentieren Geänderte Übersetzungen aktualisieren”前打钩;点中“TM aktualisiere”和下面另一选项的“Ersetzen”。
 


图3 

2)我根据自已多年努力收集和整理,拥有大量电子文档excel文件的术语和例句的实际情况,为便于句库管理和使用,不希望用独占方式打开TM,故放弃用excel转换成Txt文件,再用TWB输入TM的办法。而是直接把建句库的excel,转换成xdtxml文件,输入MultiTerm,变句库为词库。再将原excel句库的中文去掉,将德文另存为Unicod文本的txt文件,使德语中的变元音不受转换格式的影响。再将txt复制到word进行翻译,或者进入Tageditor中翻译。因为已建立有对应的MultiTerm词库,翻译实际上就是过一趟,走走形式,将在TWB右侧显示的汉语复制一下就完事了。最大的优点是可以将上述两种方法制成的TM句库,以及今后的所有TM文件集中在两个句库内,一个为德汉句库(DC.tmw),另一个是汉德句库(CD.tmw)。这样一来当我作德译汉时,一打开TWBDC.tmw,句库就加进去了。

三.用TWB的有关窗口检查建TM库(句库)的实际效果并要求经常进行数据维护

为了检查TM句库的建立效果,打开TWB中“Datei”菜单,查看“Eigenschaften...”(图4),点黑左侧的“Seitdem erweitert um Übersetzungseinheiten”项,右侧显示的值是已建立的TM句子数。说明上述的建库方法已成功。
 


图4


TM数据维护的方法是打开TWB中“Datei”菜单,查看“Datenpflege...”(图5),再按窗口有关项要求进行。


图5

.翻译实例
为了检查实际翻译时的使用效果,打开TWB,选择DC.tmv的TM,再打开一份文档,其上是随意选取的几个德语句子(图6)。关闭MultiTerm词库。


图6

结果表明:
1.翻译速度非常快,按动“翻译键”,译文立即上屏(图7)。若接着按“译至下一个完全匹配键”,只见译文页面快速向下翻动,不到0.1秒钟这几条就译完了(图8)。我曾作过10000个句子的翻译试验。因有少数句子与句库不完全匹配,稍有停留,再按一下此键,又继续往下译。也就是十几分钟的事,便完全译好。与用MultiTerm时相比,速度快很多。因为词库有100多万词条,它是每个术语都要查100万次,而句库的句子目前只有30000-40000条,它又是按句来查,所以句库用起来速度极快。

2.只要是完全相同的句子,直接上屏。不需要用复制和粘贴键。

3.译者可视需要选择匹配度,因为在翻译过程中,完全匹配句子的几率是很小的,同样一个句子,往往因人称,状语,和其它句子次要成份的变化而变化。此时若降低匹配度,可以数倍地扩大句库的利用率

 

                         
图7


图8

4.句库可以和词库同时使用(图9)。图的上部为TWB,已打开DC.tmw 句库。最下部是MultiTerm,已选中30个词库文件(超过的100万词条)。中部是word文件。当按动带上下箭头的“翻译键”时,因为此句有完全匹配的句子,在TWB的下窗口和word的翻译栏立即显示译文。若不完全一样, 软件会标记不同之处,供译者修改。同时在TWB上窗口又用红线表示出词库中已查到的术语,右侧是粗红线所指术语的解释,术语靠“跳转键”选择。



图9

 

相关文章 论主动建立专业词库问题

       多屏显示技术在计算机辅助翻译中的应用
 
       MultiTerm用 专业词库在Trados中应用时的查词速度、影响因素及其改进意见

       用“主题词”收集专业分类词汇

       用“Excel”创建专业术语数据库