编者多年来在CAT中的实践

 

 



论主动建立专业词库问题
  
                         

- 江河水 -

 

                              引言

笔者根据自已的亲身体验,建议用户在使用Trados的整个过程中,应高度重视主动建立并不断维护和增补专业词库和句库的工作。这里的“主动”是指用户按照自已所从事的和熟悉的的专业,根据本身需要,将自已过去收集的、词典和书本上现成的、得到业界认可已约成俗定的的术语和和合符语言规范 ,即遵守语法规则和口语或书面语言习惯的例句,用一定的工具或方法,主动建立专业词库和句库。“被动”建库,是指一切随自然。单靠自身用TWB翻译,一句一句慢慢积累 或企图依赖所谓网络资源,把一切希望寄托在目前并不非常靠谱,有点虚无飘渺的网络上。将MultiTerm只用来规范个别客户所提供的少得可憐的专业术语 。“被动”建库的缺点是周期长;由于受译员本身水平高低不等和专业限制,使用的术语和译文未必是经典的和规范的。产生这样和那样的错误是难免的。 用这样的术语和例句构成词库和句库,以错指导后面的翻译,后果是可想而知的事。当然主动建库并不容易,但这是工作的需要,是专业翻译技术创新的迫切需要。笔者经验说明,依靠自已长期坚持努力,作好这件事也是有可能的。
本文只讨论
建立专业词库问题,谈谈个人在六年多建库实践中的一些感受

一.专业翻译技术创新的必要性

1.必须改进目前笔译时需要用手工操作查阅大量专业技术词典的落后状态
目前翻译查字典还处在原始状态,每个不清楚和不理解的专业术语都必须从一本一本词典中去查。字典上的字小,一天工作下来,相当劳累,尤其是眼睛吃不消。翻译在日常工作中大多数的时间是用于查找专业术语,翻阅大量的词典和参考资料。而只留下较少的时间用于对原文的理解和译文的造句、表达和修饰。长此以往,不利于提高译文质量。
尽管现在已经研发出了许多出色的像Trados这样的翻译记忆软件,但是先进的翻译记忆功能却没有能从根本上改变和减轻翻译每天需要大量时间,从事查阅词典的繁重体力劳动。这便是当前的实际情况。Trados的MultiTerm具有杰出的查阅专业术语的功能,但因目前还缺乏专业词库,这些功能便成了摆设,发挥不了应有的作用。

2.建立专业词库的优点
这里所谓的建立并非简单的术语收集,整理,而且要求编辑者进行大量、长期、艰辛和创造性的劳动,使收集和整理的专业术语转变成可为计算机和有关软件利用的词库资源。这种为MultiTerm软件建立的词库资源的最大优点在于,可按原文专业选择相应词库文件,在数十万或上百万术语词条中,实现同时查阅几个到几十个专业术语,当用word或Tageditor进行翻译时,每译一个句子,在Trados的翻译记忆平台Workbench上部译文框内,自动用红线标记出所有已从词库查到的专业术语。用软件上的或计算机键盘上的控制箭头可很快得到有关术语的解释。先通过译者的大脑思考,过滤和选择后,再上屏入句;故其最大优点是充分利用计算机的强大威力,转眼之间以每秒数十万、乃至数百万词条的查找速度查出所需的专业术语。根本不需要像有些电子词典那样只能一个字或一个词地输入。既不用手翻查词典,又能更好利用词典资源;这种 词库的建立工作,对广大译校人员来说,其意义并不亚于Trados软件的其它翻译记忆功能。不是Trados软件的研发人员没有意识到这一点,他们已经认识到了,因为已经有了非常优秀的词库软件MultiTerm便是证明。但是我们还不完全清楚他们没有建立相应词库的真正原因。

3.建立完善的专业词库和TM翻译记忆库(句库)是解决此问题的两个关键
提高翻译质量除了要求有高素质合格的专业翻译外,还需要一些好的翻译工具。过去这些工具通常是指笔、稿纸、词典和参考资料。现在则主要依靠计算机、计算机辅助翻译记忆软件(CAT软件如Trados等)和用于代替查词典的词库和句库软件,因此建立完善的专业词库和句库是当前翻译技术创新的迫切需要。
俗话说,“好马配好鞍”,光有合格的翻译人员和校对人员,没有好用的计算机辅助翻译软件,以及光有好的软件,没有合符要求的专业词库和句库,也是不行的。
提供的完善化专业词库和句库必须包括现今常用的主要的专业学科。

4.建立各语种的完善的专业词库和句库是一项巨大的系统工程
计算机辅助翻译记忆平台软件制造厂商(如Trados公司)已为词库提供了优良的应用软件MultiTerm, 如能再提供完善的词库和句库就更好了。也许要求制造厂商和软件开发人员投入几年,十几年时间和大量资金去作这种看起来简单、无味、费力、费时的工作是不现实的, 或者说这种工作由用户按自已需要自已来作更合适。因为对进行这种工作的人有较高的要求,必须懂专业技术和有长期从事专业翻译工作的经验。更需要具有任劳任怨的工作态度,甘为人梯的献身精神。
建立词库和句库工作工程量很大。需要中国译协组织精通外语的各行各业的专家,统筹安排,合理分工和参与建库人员长期奋斗才能完成。

二,关于本“德汉-汉德专业词库”的简介
 

1.建立词库的过程
笔者是一位从业50多年的德语专业翻译。一辈子都在和笔、纸和各种各样的专业技术词典打交道。深感专业术语对翻译人员的重要性,渴望尽快改变工作中频繁手工查阅大量专业技术词典的落后状态。1994年开始使用Trados软件,这种软件在用TM解决已翻译资料记忆,避免重复翻译方面具有杰出的功能。衷心感谢软件制造者替广大翻译作了一件了不起的好事。但也认为它不够完善,即记忆功能有余,翻译功能不足。使用Trados并不能减少多少查词典的工作量。关键是缺乏专业词库。笔者为了自已工作的需要,开始时用大半年时间先建了一个拥有10多万词条的机电方面的词库。一经试用,感到效果还不错,坚定了信心。后来,只要一有空便投入这项工作,先后共用了六年多时间。现在这个德汉-汉德专业词库已基本完成。

2.本词库的使用对象、专业范围、参考资料和词条数量
 
本词库侧重于机电工程,主要使用对象是自已,当然也可供下列同仁使用:

  • 翻译公司的德语翻译和校对人员
  • 各大专院校的德语系师生
  • 其它科技德语自由翻译人员
  • 所有使用Trados进行德汉-汉德翻译的人员
  • 使用德语的外贸工作人员

    包括的专业范围

本专业词库的专业范围:

金属加工机械

普通加工机床

数控机床

各种生产自动线设备

机械制造工艺

无削加工设备

机电一体化设备

各种机电类的规程

德文版的EN标准

各种有关的德国标准DIN

德国专利

行业标准

工厂标准

焊接标准

焊工培训和考试

火力发电设备

水力发电设备

核电设备

材料和试验

包装机械

食品机械

饮料机械

建材机械

冶金机械

粮油加工机械

塑料机械

纺织印染机械

缝纫服装机械

制鞋和皮革加工机械

纸制品加工机械

印刷机械

药品加工机械

矿山机械

环保机械

化工机械

工程建筑机械

农业机械

金融用机械

商业机械

邮政机械

电动工具

气动工具

风机

锅炉

汽轮机

雕雕刻机

干燥设备

前/后热处理设备

泵/真空设备

起重/装卸机械

液压设备及其配件

过滤和分离设备

煤气发生器

水轮机

发电机

空气预热器

空调和换热设备

烘箱和热工设备

机械零部件

喷射/喷雾设备

粉碎/筛选设备

光电子/激光设备

仪器和仪表

模具

压缩设备

实验和试验设备

   主要参考资料

    (1)德汉工程词典(罗沛霖 李远主编) 国防工业出版社出版,1996年
    (2)德汉机电工程词典(张竞干等编) 机械工业出版社出版,1985年
    (3)德汉兵工技术词典(<词典>编辑组编) 国防出版社出版,1986年
    (4)德汉经济和经济法词典(梁华生编)中国对外翻译出版公司出版,1993年
    (5)汉无线电词典(<词汇>编委会)国防出版社出版 1966年
    (6)德汉汽车技术词典(徐荣达编)人民交通出版社出版,1982年
    (7)德汉经济贸易词典(王正富等合编) 商务印书馆出版,1988年
    (8)新德汉科技词典(刘清水主编) 吉林大学出版社出版,2000年
    (9)德汉。英汉。德英传动技术词典(Thomas Antoni编,熊其求译)机械工业出版社2006年
    (10)德华冶金工业词典(词典编辑组)冶金工业出版社 1972年
    本词库德汉-汉德双向专业术语词条数共计约226万条

    .应用例

    明:本词库是为Trados的MultiTerm软件而专门建立的。因要求使用Excel文件作为词库的原始数据资料,Excel表格的行数是有限制的,所以分为若干个库文件。拥有了这套原始数据资料,可以方便地为其它软件所使用。尤如是一堆建筑材料,能用于建造各式各样的东西一样。故其用途绝不局限于只为MultiTerm作词库。

    MultiTerm-Tageditor(Word)-Workbench联合应用
    这是本德汉-汉德专业词库最能充分发挥优势的用途。可根据翻译的具体项目(专业)选择所需的词库文献(类似于专业词典)。笔者按本身计算机配置, 开始时经常一次调入10个以上的词库文件约50多万词条。软件每下移一段(一句或数句话),便可在,Workbench的上显示区用上部红线标记出已从词库中查出的术语。不难看出,凡是计算机认为是能查到的术语均被标记出。特点是不需要一个一个地输入需查找的词,计算机可同时查出数个到二、三十个术语。每个查到的术语,译员确认后便可上屏,然后用Tageditor 和Word上的箭头在术语音跳转,这样一来,便可极大地减轻翻译和校对查词典的劳动强度,使他们有更多时间专注于理解、思考和表达,从而提高翻译质量。一次可同时查出的术语量取决于段落和句子的长短以及使用者计算机的配置高低。用笔者这台笔记本:CPU为AMD II P340 双核2.2GHz,内存为2g DDR3,操作系统因受Trados 2006与win7 64位系统不兼性困扰,只能用win7 32位系统。我作过同时调入70万词条的试验,如果能换成Trados9、win7 64位系统,并采用8g内存,一次调入超过100万的词条均不成问题。

     




    图1 用操纵箭头在专业术语词条间移动的用法说明


    图2 一次在MultiTerm和workbench中调入许多专业术语词库文件例


    3 同时调入超过50万词条的 词库文件在翻译资料时应用的实例 之一



     4 同时调入超过50万词条的 词库文件在翻译资料时应用的实例 之二


    5 一次同时查出4-6个汉语专业术语的实例 之一


    图5b 一次同时查出4-6个汉语专业术语的实例 之



    6 一次同时查出4-6个德语专业术语的实例 之一


    6b 一次同时查出4-6个德语专业术语的实例 之二


    7 一次同时查出12个汉语专业术语的实例之一


    7b 一次同时查出12个汉语专业术语的实例 之二


    一次同时查出24个汉语专业术语的实例


    一次同时查出22个 德语专业术语的实例


     

    相关文章 多屏显示技术在计算机辅助翻译中的应用
     
          
    论主动建立专业翻译记忆库(句库)问题
     
           MultiTerm用 专业词库在Trados中应用时的查词速度 、影响因素及其改进意见

           用“主题词”收集专业分类词汇

           用“Excel”创建专业术语数据库