Google将LLM翻译与人工翻译流程相结合--翻译技术速递

在2024年9月10日的一篇论文中，谷歌的研究人员介绍了一个多步骤的过程，旨在通过模仿人类翻译工作流程来提高大型语言模型（LLM）的翻译质量。他们解释说，机器翻译（MT）一直被视为一个“单一的，整体的任务”，其中源文本被简单地翻译成目标语言。然而，谷歌的研究人员认为，翻译是一个“多方面的过程，包括几个子任务，浏览双语景观。” 他们强调，“大型语言建模的最新进展为重新定义机器翻译提供了希望，使其与人类翻译过程更紧密地结合起来。为此，他们提出了一个框架，使LLM参与一个多回合，一步一步的过程，包括四个不同的阶段：翻译前研究，起草，精炼和校对。这个过程开始于LLM被提示进行背景研究，以确定翻译源文本的潜在挑战。接下来，起草阶段的重点是创建一个初始翻译，优先考虑忠实于原始文本。然后对草稿进行修订，以提高其流畅性和连贯性。最后，校对阶段确保翻译是抛光和无错误。通过将翻译前（研究）和翻译后（改进和校对）阶段整合到一个框架中，谷歌研究人员的目标是“简化翻译过程”，同时完全依赖LLM的内部知识，消除对外部资源的需求。拟议的框架从LLM中使用的思想链提示技术中汲取灵感。通过将翻译任务分解为更小的、可管理的步骤，该模型可以生成更准确、更适合上下文的翻译。研究人员使用Gemini 1.5 Pro模型对10种语言的长格式文档（文档级翻译）进行了测试，包括中文，乌克兰语，俄语，日语，希伯来语，捷克语，德语，印地语，冰岛语和西班牙语。他们将他们的方法与传统的零镜头翻译技术（其中模型被指示直接翻译源文本）以及早期使用自动评估指标的类人LLM驱动方法进行了比较。他们发现，通过逐步过程生成的翻译优于传统的零镜头翻译，特别是在上下文至关重要的文档级翻译中。“与通过单个提示直接翻译整个文档相比，我们的方法提高了翻译质量，”他们说。研究人员强调了翻译前研究和翻译后改进阶段的重要性，并指出，当这两个阶段结合起来时，质量的提高最为显著。“这些阶段带来了额外的好处，”他们说。 “我们的研究结果强调了LLM逐步改进其翻译的潜力，超越了传统的机器翻译作为单一序列映射任务的观点，”研究人员总结道。作者：Eleftheria Briakou，Jiaming Luo，Colin Cherry，Markus Freitag

以上中文文本为机器翻译，存在不同程度偏差和错误，请理解并参考英文原文阅读。

阅读原文

机器翻译

工具

翻译管理

本地化