机器翻译译后编辑(PEMT)并非昨天才诞生的(例如Wordbee中的机器翻译和译后编辑技术已十分成熟)。相反,译后编辑几乎和机器翻译(MT)同时诞生。尽管目前有大量关于此主题的材料可供使用,但是讨论的细微差别使得在某些情况下我们冒着忽视PEMT真正含义的风险。
PEMT:无需创新
首先,PEMT与修订无关,也不需要所谓译创的“创造力”。尽管有关于该主题的所有文章和全新的ISO标准,但迄今为止,最准确的译后编辑定义来自2010 TAUS实践中的译后编辑报告:“译后编辑是用‘最少的人工’改进机器生成的翻译的过程。”
此定义中的关键是“最少的人工”。
修订是基于对源文本和目标文本的对比分析,需要修订者检查和编辑术语、风格和语法,而PEMT的特点是生产率更高且认知双语要求不高。主要更改将涉及机械性错误(大写和标点符号)、语法错误,术语不一致(例如,单词遗漏)以及其他问题,这些问题通常是源文本质量较差并导致目标文本可读性较差的结果。译后编辑者不希望重写整个句子(除非这些句子很明显是胡说八道或存在言语杂乱的问题),因此他们仅应修改必要内容以使句子更清晰易懂。
修订者与译后编辑者的技能也有所不同:修订者必须对源语言和目标语言、翻译技巧和特定领域都有全面的了解,而译后编辑者甚至可能仅懂一种语言。但是,不管怎样,他们必须对目标语言和特定领域有深入的了解,并且最好对机器翻译的工作原理有所了解。
实践中的3种PEMT方法
PEMT与企业
让我们以一家已经开发自己的引擎的企业为例。PEMT任务可以在CAT环境中进行,或者对于拥有自己的MT引擎但没有翻译部门的企业,则可以将其委托给外部语言服务提供商(LSP)。
因为我们使用了定制引擎,因此MT输出的质量会比较高。PEMT指南将非常具体,并会严格根据相关发动机产生的错误类型进行精确处理。有必要指出必要的PEMT水平(轻度或充分的译后编辑),以及文本目的和目标人群。MT引擎刚刚投入使用就显现出术语上存在问题,术语表至关重要。
PEMT和LSP
只有少数LSP具有开发为客户定制MT引擎所需的财力和技术资源。大多数LSP选择使用由MT技术提供商开发的垂直领域(特定领域的)的引擎,并根据SaaS模式(租赁模式)按次付费。MT输出将发送到内部或外部的译后编辑器。或者,译后编辑者会收到API密钥,以在CAT工具环境中使用垂直级MT引擎。在这种特定情况下,译后编辑成为一项交互式任务。
一些LSP会使用通用MT引擎(例如Google Translate或DeepL)预先翻译源文本。如果您刚开始使用MT、翻译短篇文本或再次面临财力/技术资源短缺时,这是一个可行的经济型选择。
在这种方法中,由于译后编辑的级别和目标会因项目而异,或者因客户而异,因此LSP总是需要提供有关翻译最终用途的信息以及有关如何执行任务的准确指南。PEMT项目可以在许多译后编辑中进行划分:指南的具体程度和严谨程度将在一定程度上确保翻译产出的一致性。提供客户专用的术语词汇表、保证术语一致性也很重要,尤其是在使用通用引擎的情况下。
PEMT和自由译者
自由译者反对机器翻译的日子一去不复返了。如今,大多数自由译者都把机器翻译作为提供翻译建议的有用工具。他们通常选择谷歌翻译或DeepL (网页班版本或使用API密钥)。
在这种情况下,自由译者通常没有精确的PEMT指南。自由译者可选择使用一个或多个通用MT引擎,自由决定使用哪种MT工具,如何使用它,以及采用多少MT输出。但从职业道德的角度来看,自由译者应该告知客户其使用了通用MT引擎,或者询问客户是否有不能使用通用MT引擎的特别要求。要注意医疗记录、法律文件(涉及敏感信息或个人资料,总而言之就是要遵循通用数据保护条例)以及机密文件或知识产权保护文件。
要记住一件事:当在CAT工具环境中通过API密钥使用通用MT引擎时,在某些情况下,包含MT输出的片段可能被标记为AT(自动翻译)或MT(机器翻译),从而显示它们的来源。
翻译流程中的PEMT
同样值得注意的是,自动翻译并不是由一台拥有自由意志和独立(尽管是电子的)大脑的机器创造出来的。MT输出(自动翻译的技术术语)是由随机计算生成的,就像统计和神经机器翻译一样,由算法生成;该算法利用双语翻译语料库,更广泛地说,利用人类的语言数据。可能有不同原因影响机器翻译输出质量的高低的:缺乏清晰的语言数据,MT引擎发展所需的技术资源和财力短缺,源文本的质量不高等等……但所有这些原因的共同点是都包含人的因素。
PEMT应该取代TEP(翻译、编辑、校对)模式的两个主要阶段。为了实现MT引擎应用,有必要使翻译工作流程根据该项技术作出改进,并确保您的TMS(翻译管理系统)具备有效管理PEMT阶段所需的条件。
如果您开发了自己的MT引擎,则TMS提供程序应使您能够通过API密钥进行连接。
译后编辑人员应掌握语言资源:拼写检查字典、术语库,并应具有上传PEMT指南作为参考资料的能力。
项目经理应会使用自动质量检查和100%匹配检索、为特定句段添加标签等功能。
译后编辑培训
如今可用的PEMT课程提供了有关机器翻译工作原理的一般培训,并提供了一些有关修订和后期编辑之间差异的示例。 由于在许多情况下差异很小,因此无需使用Google Translate和DeepL的MT输出进行长时间的培训。
无论您是LSP还是一家企业,要帮助译后编辑人员提高工作效率,请务必根据定制MT引擎(特定领域、语言对和文本类型)对译后编辑人员二级培训。
请勿忘记自动译后编辑的基础:告诉您的译后编辑人员可以对MT输出进行哪些功能和操作,例如,如何在工作环境中将建议可视化以及如何修改它们。
译后编辑:罗温馨(中山大学)
以上中文文本为机器翻译,存在不同程度偏差和错误,请理解并参考英文原文阅读。
阅读原文