推荐理由】 一个根据统计和实例方法的语料库翻译方法正向我们慢慢走来。笔者认为这是一种较好的解决目前计算机辅助翻译所有问题的药方。如果CAT用这种翻译语料库来取代目前的TM和MT将收到神奇的疗效。使用适合翻译工作的语料库,不需要再区分词库和句库,现在的翻译记忆功能只作为译过的句子“废物回收”,再次加入句库供参考。 这种语料库搜索资料时不用词或句进行匹配,而是采用效率极高的字符串匹配技术。它的发展建立在现代科技,尤其是计算机硬件突飞猛进般进步的基础上,同时它也是建立在大数据、云存储基础上,从而可使翻译语料库容量成万倍地增加。以没有必要再分成数十个库文件。 当然,译员用的翻译数据库,与下面推荐采用的一般语料库不完全相同。但笔者相信,如用语料库,必将使CAT青春焕发。用途大增。译员受益。 【文摘1】 "语料库(corpora)是应用计算机技术对海量自然语言材料进行处理(包括预处理、语法自动附码、自动句法分析、语义分析等)、存储,以供自动检索、索引以及统计分析的大型资料库。它是按照明确的设计标准为某一具体目标而建立的语言资料库。如果作进一步区分,还可以把语料库与大型文档资源库区别开来。前者具有明确语料选择比例和设计标准,而后者更注重语料容量和语料来源的多样性(Edwards1993)。所谓自然语言是指任何人类在童年习得的语言。使用这一概念的意义在于,把人类自然语言同人工编制的人工语言(如C语言、BASIC、JAVA、FORTRAN等)区别开来;在对语言描述和研究中,自然出现的语料不同于研究者为某一目的而引出的材料。语料库的研究对象是人类语言自然运用,而不是内在语言能力。" 李文中《语料库、学习者语料库与外语教学》 【文摘2】 "早在本世纪60年代,美国Brown大学创建了最早的语料库BROWNCORPUS,容量为100万词,广泛搜集了当时美国英语各种文体的语言材料。与此相呼应的是70年代初在欧洲同样容量的LOB语料库,搜集了同年代的英国英语材料。基于这两个语料库,开展了大量的重要研究,研究的重点是对英语语法的描述和分析(Rundell1996)。另外,70年代初还建成了50万词的英语口语语料库London Lund Corpus(LLC)。但对于大规模的词汇研究(如词典编纂)而言,100万词的容量显然不能满足要求。80年代初,由Birmingham大学JohnSinclair主持建成了专门用于词典编纂的大型语料库BCET。该语料库最初容量为730万词,到80年代中期,其迅速扩充为2000万词。与此同时,朗曼公司词典部开始建立自己的语料库容量达到3000万词。 在我国,上海交通大学杨惠中教授在80年代末主持建成了容量为300万词的科技英语语料库,主要用于大学英语教学大纲制定和教材开发。80年代建成的语料库还有Lancaster的英语口语语料库、用于跨文化比较的PIXI语料库。90年代初,包含英国书面英语和口语容量为1亿词的英国国家语料库建成(BNC),而伯明翰大学的BCET语料库进一步扩展为英语库,容词量为两亿。到90年代中期,朗曼公司在BNC库中又增加1亿词美国英语,COBUILD的 英语库进而增长至3.2亿词。"  李文中《语料库、学习者语料库与外语教学》 【文摘3】 "1996年8月在芬兰举行的“第十一届世界应用语言学大会:开发计算机学习者语料库”,与会者从不同角度对学习者语言进行了初步探讨。如Aarts对多义动词的对比研究,Altenberg对瑞典英语学习者议论文写作中各种词汇、语法和话语特征的滥用或少用的研究,Kaszubski研究了波兰英语学习者词汇的重复和华丽语句的运用;Lorenz对德国英语学习者英语写作中词汇搭配能力、非词汇化以及信息结构的研究,Milton则讨论了机助语言学习设计问题,对比分析了学习者语料库中数量限定词、核心形容词和动词、衔接词以及动词短语的频率。 最近,在中国即将建成的容量为100万词的中国学习者英语语料库(CLEC),广泛搜集了专业英语、大学英语以及中学英语学习者的各种书面语资料。该项目由广东外语外贸大学桂诗春教授和上海交通大学杨惠中教授负责主持、国内十几个院校合作完成,目前已完成人工错误附码,语料库建设已近尾声。" 李文中《语料库、学习者语料库与外语教学》【文摘4】 "语料库的出现不仅标志着语言学研究手段的技术进步,还标志着语言研究思想的重大转变。它代表一种新的语言学思维,一种新的事业。语料库方法注重运用而非能力,重描述而非普遍语法,重量化分析而非定性分析。 语言学家对语言的研究从传统的直觉经验方法转向基于实验和统计的方法。但Granger认为这两种方法可以互补,而不是相互排斥。语料库在语言描述和分析中发挥着愈来愈重要的作用。“现在不会有人试图不使用语料库信息就去编制新的词典。的确,对该领域大多数人而言,不参照实验性数据而试图进行语言描述的想法将被视为反常。” 李文中《语料库、学习者语料库与外语教学》