DeepL是怎么工作的?

2021-12-06 23:50:08 DeepL

本文共5239个字,阅读需14分钟

阅读模式 切换至双语

我们经常被问到,为什么DeepL Translator通常比主要科技公司的竞争系统工作得更好。这有几个原因。和大多数翻译系统一样,DeepL翻译器使用人工神经网络翻译文本。这些网络接受数百万翻译文本的培训。然而,我们的研究人员已经能够对整个神经网络方法进行许多改进,主要在四个方面。 众所周知,大多数公开可用的翻译系统都是对Transformer架构的直接修改。当然,DeepL的神经网络也包含这种结构的一部分,比如注意机制。然而,网络的拓扑结构也存在显著差异,这使得翻译质量总体上比公共研究的最新水平有了显著提高。当我们在同一数据上对我们的体系结构和最著名的变压器体系结构进行内部培训和比较时,我们清楚地看到了网络体系结构质量的这些差异。 我们的大多数直接竞争对手都是大型科技公司,它们有多年开发网络爬虫的历史。因此,它们在可用的训练数据量方面具有明显的优势。 另一方面,我们非常重视有针对性地获取特殊培训数据,以帮助我们的网络实现更高的翻译质量。为此,除其他外,我们开发了特殊的爬虫程序,可以在互联网上自动查找翻译并评估其质量。 在公共研究中,培训网络通常使用“监督学习”方法进行培训。网络一遍又一遍地显示不同的示例。网络反复将自己的翻译与来自训练数据的翻译进行比较。如果存在差异,则相应地调整网络的权重。 在训练神经网络时,我们还使用机器学习其他领域的其他技术。这也使我们能够实现重大改进。 与此同时,我们(和我们最大的竞争对手一样)培训具有数十亿参数的翻译网络。这些网络非常大,只能在非常大的专用计算集群上以分布式方式进行训练。 然而,在我们的研究中,我们非常重视这样一个事实,即网络的参数得到了非常有效的利用。这就是我们如何通过更小更快的网络实现类似的翻译质量。因此,我们还可以为免费服务的用户提供非常高的翻译质量。 当然,我们一直在寻找非常优秀的数学家和计算机科学家,他们希望帮助推动发展,进一步改进DeepL翻译,打破世界各地的语言障碍。如果您还具有数学和神经网络培训的经验,并且如果您能够免费使用全球范围内的产品,请向DeepL申请! 我们很高兴宣布对DeepL API的术语表支持! 词汇表可供DeepL API免费用户和专业用户使用。如果您还没有帐户,可以在此处创建帐户。 我们在2020年首次为我们的web翻译器和桌面应用程序添加了词汇表支持,它已成为我们用户非常喜爱的功能。无论您是否正在翻译,用例都是多种多样的… ...通常有一些特定于品牌和行业的词汇需要你去解释。 词汇表允许您为单词和短语指定自己的翻译,从而使您能够以一致性和规模定制翻译,这样您就可以向用户提供尽可能最好的结果,而无需将大量手动工作推给翻译和内容团队。对于我们的API用户来说,这是一项特别重要的功能,他们通常在构建自动化的翻译工作流,在词汇表的帮助下,可以进一步自动化。 对API的词汇表支持还将使具有DeepL插件的CAT工具提供商能够在其产品中构建词汇表功能。 如果您想学习如何在API中使用词汇表,或者您已经准备好开始,您可以查看API文档。 在这篇文章的其余部分中,我们将更多地分享您可以从该特性中期待的东西。 目前,API的词汇表可以为DeepL web translator和桌面应用程序上的词汇表创建相同的语言组合: 我们的团队正在致力于添加更多的语言组合很快。 通过DeepL API创建的词汇表不同于通过DeepL web translator和桌面应用程序创建的词汇表。这意味着API词汇表不能用于web翻译程序和桌面应用程序,反之亦然。 DeepL API Free和Pro用户都可以创建多达1000个词汇表。词汇表的最大大小限制为10 MB。 总而言之,以下是开始使用API中的词汇表以及在需要时获得帮助所需的一切: 我们很高兴地宣布,我们为DeeplAPI发布了Python客户端库。这是我们为API构建的第一个特定于编程语言的库,我们的目标是让使用Python的开发人员更容易使用DeepL构建应用程序。 简单多少? 下面是一个文本翻译示例。过去是什么: 现在是: 我们打算在Python库中支持DeepL API的所有函数,尽管在将新特性添加到API后,可能会向Python库中添加对它们的支持。 如果您只需要听这些,并且希望立即开始,您可以在这里找到Python客户机库和文档。 (顺便说一下:使用Python库需要API身份验证密钥。如果您还没有密钥,可以在此处注册免费或专业API计划。) 在本文的其余部分中,我们将分享更多关于Python库项目的信息,以及您可以如何参与其中。 Python非常适合我们的第一个客户端库。它是世界上使用最广泛的编程语言之一,在我们的API用户群中很受欢迎。这也是一种我们在DeepL有很多经验的语言。 也就是说,DeeplAPI的使用案例非常广泛,除了Python之外,还有许多语言对我们的用户非常重要。我们正在探索未来可能开发的其他客户端库,如果您对最重要的语言有任何反馈,请联系我们并让我们知道 Python客户端库也是DeepL有史以来第一个开源项目。我们一直在寻找向用户学习的新方法,并确保我们的产品能够为他们解决实际问题。 我们相信,开源项目是促进关于用户需要什么以及他们遇到什么问题的透明讨论的最佳方式,如果您有想法或反馈,我们鼓励您提出问题。 当然,GitHub问题并不是解决在使用Python库时可能遇到的每一个挑战的合适地方。如果您的帮助请求包含敏感数据,请联系我们的支持团队。我们很乐意帮忙。 总而言之,如果您想开始使用DeepL的Python客户端库,您可以: 谢谢你的阅读。我们很高兴看到你的作品。 你有没有想过能立即流利地使用另一种语言?也许你在旅行时看不懂菜单,或者你遇到了一个新朋友,但不会说同样的语言。 使用我们新的iOS移动翻译应用程序,您可以告别语言障碍。无论您身在何处或与谁在一起,您都可以取出iOS设备,轻松访问DeepL的准确翻译。 该应用程序可以在iPhone和iPad上访问,并允许用户在移动中进行翻译。它支持所有26种DeepL语言和语言变体,以及其他DeepL优势,如快速翻译、快速语言检测和一流的翻译质量。 此外,您还可以尝试语音到文本转换功能,该功能允许您使用设备的麦克风转换语音输入。它还可以通过另一种方式使用文本到语音功能,该功能允许您收听文本输入及其翻译。 这是我们DeepL团队的又一个激动人心的里程碑,我们将继续努力消除语言障碍,将文化融合在一起。 渴望在你的iOS设备上开始翻译?你可以在这里免费下载应用程序。 我们很高兴与大家分享,DeepL Translator现在支持13种新的欧洲语言:保加利亚语、捷克语、丹麦语、爱沙尼亚语、芬兰语、希腊语、匈牙利语、拉脱维亚语、立陶宛语、罗马尼亚语、斯洛伐克语、斯洛文尼亚语和瑞典语。 多年来,许多人要求我们为我们的翻译人员添加更多的语言,以便他们能够享受DeepL的准确翻译。随着新语言的发布,我们很高兴能够同时满足其中几个请求。 通过此次发布,DeepL现在可以为全球约1.05亿母语人士提供自然、高质量的翻译。这使我们能够进一步推进公司的愿景,打破语言障碍,使文化更紧密地结合在一起。 我们不断努力确保所有语言的翻译质量保持卓越,并确保所有用户的翻译过程无缝。如果您的首选语言尚未提供,请不要担心,我们将在未来添加更多语言。 从“Sziasztok”到“Hej”,我们已经准备好向新用户问好,并期待他们的反馈。所有十三种语言现在都可以在DeepL.com上通过DeepL API获得,也可以在我们的桌面应用程序DeepL for Windows和DeepL for Mac中获得。 准备好为自己尝试新语言了吗?现在前往DeepL Translator开始翻译。 DeepL现在可以更轻松地获得您喜欢的风格的英语翻译:DeepL翻译人员现在可以生成反映美国和英国英语特点的翻译。 本书涵盖了不同的拼写:美国邻居变成了英国邻居,他们可以通过手机或手机互相通话,这取决于你的喜好。 同样,整个池塘中具有完全不同等价物的术语也被考虑在内。美国饼干变成了英国饼干。当然,也就是说,除非它们在您的web浏览器上。 这种对DeepL Translator的扩展控制使您能够更快地获得尊重您喜欢的语言约定的翻译。要设置您想要的语言种类,只需选择“英语(美国)”或“英语(英国)”作为目标语言。 美国英语和英国英语现在可以通过DeepL API在DeepL.com上作为目标语言使用,也可以在我们的桌面应用程序中作为目标语言使用,DeepL for Windows和DeepL for Mac。将此功能与其他功能(如词汇表)相结合,可以让您完全控制DeepL Translator为您生成的英语文本。 *请注意,这两种语言变体目前不适用于日文和中文的翻译。这两种源语言将在不久的将来添加。 自从我们将日语添加到DeepL Translator中以来,我们对日本人使用我们服务的速度感到惊讶。我们优先考虑在日本提供付费订阅服务DeepL Pro,现在我们可以宣布这已经成为现实。 所有提供额外数据保护、无限翻译能力、API访问等功能的DeepL Pro订阅计划现已在日本推出。日本客户也从日元价格中受益。 我们继续在世界各地扩大DeepL Pro的覆盖范围,并将在不久的将来增加更多的国家和货币。 有什么比找到准确的词来表达自己更好呢?总是找到准确的词来表达自己!我们新的术语表功能使您能够准确地确定DeepL Translator应该如何为您翻译术语。 无论您翻译法律合同、技术手册或公司通讯,术语表都可以保存您使用的术语和喜欢的翻译,确保一致性并节省您的时间。 你所需要做的就是点击翻译文本中的一个单词,点击你喜欢的公式,并在被询问时保存词汇表对。或者,您可以单击“自定义”并手动输入。 您可以为名词、动词、形容词、副词甚至多词条目创建词汇表条目,DeepL Translator将调整语法和公式以适应您的偏好。您始终可以选择打开或关闭自定义功能,从而完全控制您创建的规则如何以及何时影响DeepL Translator。DeepL Translator的免费用户可以创建数量有限的词汇表对,而DeepL Pro订户可以创建任意数量的词汇表对! 目前,可以为以下语言组合创建词汇表对:德语到英语、法语到英语、英语到德语和英语到法语。在不久的将来,将添加更多的语言组合,以及定制DeepL Translator结果并使翻译成为您自己的翻译的更多选项。 我们很高兴地宣布,DeepL Pro现已在自由之地和真正的北方上市!这是我们的一个长期目标,我们非常自豪地欢迎我们的美国和加拿大朋友。 所有DeepL Pro订阅计划,提供额外的数据保护、无限的翻译能力、API访问等,都可以立即使用。此外,我们非常高兴地允许我们的北美客户以当地货币、美元和加元支付他们的DeepL Pro订阅费。 我们不断努力进入新市场,并将在不久的将来在更多的国家提供DeepL Pro。 请注意,虽然魁北克的企业可能从今天开始注册,但不久将向公民开放注册。 你是合法的!DeepL Translator现在还可以翻译成巴西葡萄牙语! 全世界各大洲的数百万人都在说各种各样的葡萄牙语。到目前为止,葡语最多的国家是巴西,人口超过2亿。 为了反映这种语言的多样性,我们的研究人员已经教我们的算法也产生在巴西使用的各种葡萄牙语的翻译。这使DeepL Translator能够捕捉到巴西的细微差别和独特词汇,以及葡萄牙、安哥拉、莫桑比克和其他国家数百万人的语言。 葡萄牙语的一些变体在“女孩正在吃早餐”这一短语的翻译中显而易见 葡萄牙人:女孩在吃早餐。巴西葡萄牙人:女孩在吃早餐。 “女孩”(女孩/女孩)和“早餐”(早餐/早餐)这两个词反映了地区差异,动词的形式也是如此;巴西葡萄牙语更喜欢动名词,而使用不定式的结构在葡萄牙和其他国家更为常见。 葡萄牙语的两种变体现在可以在DeepL.com上找到。要选择您喜欢的版本,只需单击“翻译成”旁边的语言,然后选择“葡萄牙语”或“葡萄牙语(巴西)” 享受葡萄牙语世界的诸多乐趣!

以上中文文本为机器翻译,存在不同程度偏差和错误,请理解并参考英文原文阅读。

阅读原文