关注翻译技术沙龙君,网罗翻译行业资讯
微信ID:TranTechno
本文转自”简言“
前言
17年12月13日,位于荷兰阿姆斯特丹的翻译自动化用户协会(TAUS)发布了最新的翻译行业报告,题目是《Nunc est Tempus: Redesign your translation business, now!》
“Nunc est Tempus”是拉丁语,译成英文是“Now is the time”,中文可译成“时机已到”。后半部分可译为“即刻重塑你的翻译业务”。
在TAUS发给所有会员的邮件中,这样描述这份报告:“the most daring ebook in the history of TAUS, a veritable industry event more than anything”,可见TAUS自己如何重视这份报告。
以下是这份报告的目录:
作为TAUS在中国的代表,我第一时间就看到了这份报告,看完后有很多感想,整理了一下写在这里。我今天这篇文章主要围绕报告第二章的六个话题,将我在看完后的一些真实的想法结合我对中国的翻译行业的观察记录下来,希望对正在学翻译的学生和正在教翻译的老师提供一些参考。至于翻译行业的从业者,尤其是翻译公司的管理人员,我建议去购买这份报告,仔细读一下全部的内容。
正文
我这篇读后感的题目叫:“谜一样的新技术”与“自甘堕落的老行业”。后面一部分非常激进,我想表达的确实是一种我站在外围对这个由传统翻译公司构成的翻译行业的最直接的态度,我觉得传统的翻译公司应当思考如何转型,并且付诸实际行动,否则命不久矣。
同时,我也在这里建议,优秀的翻译专业学生毕业后暂时不要考虑前往传统的翻译公司,而是去那些能让你的语言服务价值得到认可并能使之持续提升的企业。我所谓的“传统的翻译公司”是指还没有在工作流程中的方方面面进行技术升级换代的翻译公司。
我也建议各位即将报考翻译专业的大学生,在择校前要看清楚你报考的那所学校的翻译专业是否已经或正在推动技术与翻译教学、翻译实践、翻译研究等的结合,如果还没有请慎重考虑,否则研究生的两年里即便你能拿到梦想的“研究生帽子”,也无法在接下来5-10年的职业快速发展期得到升华。
我接下来尽量少说废话,把我的思考直接说出来。每一点都对应报告第二章的的一节。
一、开源算法越来越多,行业内却无人能用
“开源技术”(Open Source)是一种免费的开放技术。如果你想做一个多语言的公司网站,但又没有钱找人开发,那么可以去网上找别人开放了源代码的程序,下载下来安装在自己的服务器上,就可以上线运营了。
同样的,如果你想拥有自己的“谷歌翻译”、“百度翻译”,你也可以自己去网上下载谷歌等大企业免费共享的机器翻译引擎源代码。
这两年来,各种开源技术层出不穷,但是,行业里竟然没有几家翻译公司能在自己的服务器上搭建机器翻译引擎来训练自己的机器翻译系统。原因很简单,翻译公司一般没有自己的技术支持团队,即便有也没有机器翻译技术背景,所以免费的技术摆在面前也无法使用,只能求助懂得搭建开源机器翻译系统的高校科研团队。
但大部分翻译公司又发现他们的服务很贵,而且还不是一次性的服务,开源技术在使用过程中如果没有长期的技术支持,一旦出了问题就无法修复。很多翻译公司还不愿意将自己手里的双语数据交给陌生人。
对于翻译公司的管理人员而言,不论参加多少场神经机器翻译的讲习班,始终都觉得“神经机器翻译技术”是谜一样的技术,大致了解,但无法加以使用。
二、劳动力驱动的行业在转变成数据驱动的过程中坐吃山空
上帝毁掉巴别塔阻止人们相互沟通,那每一个人都希望语言互通吗?
翻译行业本是一个劳动力驱动的行业,有些翻译公司可以没有一个译者,但什么业务都敢接,因为业务拿到手了再全世界到处找人都来得及。有时候低价接的业务再低价给译者,因为他们业务的上游就不是什么高质量的客户。
机器翻译技术的发展让许多翻译公司也意识到机器翻译的质量比他们招聘的不少译者的质量的还要好,从排斥机器翻译到接受机器翻译。于是有人告诉翻译公司,把你们手里的“数据”拿出来,不但可以卖钱,还可以进一步提升机器翻译的质量。
从机器翻译技术起步的时候开始,技术人员就从许多机构内部获取了高质量的成熟的双语或多语语料,这些来源包括联合国、欧洲议会等语言服务的需求方(甲方),他们付钱购买语言服务,自然也拥有语言服务的产品。
除了欧洲议会这种政府背景的甲方外,还有许多商业公司作为甲方,手中也有许多成熟的语料,比如许多IT公司,在将产品卖到全世界的同时也购买了许多翻译服务来帮助他们更好的国际化,这也就是“本地化”的起源。
当机器翻译技术人员掏空了政府和商业公司的语料后,就开始通过“爬虫”来下载互联网上公开的双语或多语信息,比如网站信息、文档内容等。
等互联网的语言数据被榨干后,又有人打起了翻译公司、学校和个人的主意。比如我们国内有UTH、TMXmall、语言大数据联盟等企业和组织,尽最大程度从不同渠道购买数据、分享数据、清洗数据和过滤数据。
有些翻译公司手里的数据最开始就没有做好共享的准备,都在各种类型的文档中杂乱的存储,在共享的过程中就付出了很多精力来清洗数据,比如把PDF、图片转换成Word再进行句句对齐。有些翻译公司动作太晚,采购方有一套比对数据是否已经存在的流程,一对比发现不少翻译公司提供的数据早就有人提供了,这样的数据自然就买不上好价钱。
当翻译公司因为没有技术实力让自己手中的价值升值而卖出自己的数据给数据交易公司时,就已经走上了坐吃山空的道路。
三、翻译公司在翻译行业技术升级的过程中一败再败
中国的翻译行业升级换代过程非常缓慢,直接体现就是在翻译行业提供技术服务的公司发展缓慢。许多技术公司意识到翻译公司要使用计算机辅助翻译技术,于是向他们卖国外的现成产品,但翻译公司更喜欢用免费的单机盗版软件,一直不购买服务器版的更为强大的正版计算机辅助翻译软件。像SDL Trados这样的计算机辅助翻译工具在中国的翻译公司身上是赚不到钱的。
而计算机辅助翻译软件也在发生着从桌面端到云端的技术变革,国内外出现了大量的在浏览器里就能使用的计算机辅助翻译工具。但不少翻译公司依然拒绝这种变革,其中一个理由就是,不愿意将自己的数据放在别人的服务器上。最保险的还是自己电脑上装的盗版软件。
而当技术公司看准机器翻译技术的发展契机,开始向翻译公司提供定制机器翻译服务时,翻译公司依然因为缺钱和群心眼,无法接受定制机器翻译服务。
在这样的发展过程中,翻译公司的技术升级缓慢推进,而技术公司则看清了这些抠门的家伙,不再视他们为目标客户。既然赚不到你们的钱,要么忽视你们,要么就消灭你们。于是,一场从翻译行业上游发起的技术革命正在悄然开始。
这场“甲方翻译技术革命”是从两个方面展开的,一方面是向甲方提供节省翻译服务成本的方案,另一方面就是培养甲方,在高校里培养离不开翻译技术的翻译专业学生。
这场革命还在悄悄进行中,而且中国这么大,需要翻译服务的客户群体那么大,优秀学生的培养速度又跟不上,革命能否成功还无法预料。
可以预见的是,与“翻译”相关的衍生服务将会越来越多,原本与翻译没有关系的公司也来提供翻译服务,原本需要翻译公司介入的流程现在都在“去中间化”,互联网让翻译服务变得像水电一样随处可得,翻译服务的需求方通过技术手段可以跳过翻译公司直接获取个人的翻译服务。在中国这样的环境下,这个进程只会加速,不会衰减。
技术要替代的不是翻译服务,也许是传统的翻译公司。
四、语音翻译和语音控制让翻译服务与大众生活融入在一起
我已经不止一次用语音控制的方法来设置手机闹钟,我享受这种不用动手就能实现目的的过程。无论是国外的谷歌、微软,还是国内的百度、搜狗、腾讯,都在推动口语翻译技术的发展。
我曾经这样说,他们的目的也许并不是替代同声传译员,而是让用户可以用语音的方式与这个世界交互,用语音控制设备。
如今很多人开始使用跨语言检索的方式来浏览国外的网站,他们搜的是中文,看到的是中文,因为搜到的外文信息已经在后台转换成了中文。你能搜到的东西越多,就越想去搜索,你的搜索次数越多看到的广告也就越多,搜索引擎的广告服务就越赚钱。
当机器翻译可以把你输入的文字精准转换成另一个语言时,机器就可以把任何外文通过机器翻译转换成机器可以“看懂”的指令。机器翻译服务隐藏了后台,你可以用语音跟硬件设备(比如机器人?)交互。外国人不用学中文也可以控制中国制造的智能家居,这是不是很让人兴奋的一件事?
搞机器翻译的不需要知道文学文本如何翻译,这与他们的商业目的和最终目标没有关系,他们在乎的是在商业的世界机器翻译如何发挥更大的价值。专业的口笔译员压根没有入人家的法眼,不过是机器翻译技术发展过程中的陪跑者而已,到了终点就只剩全场的聚光灯了,没有人会去关注陪跑的人。
五、与中文有关的翻译服务和中国市场将不断升值
这部分我没有什么想说的。全世界的人都想赚中国人的钱,中国人也想把自己的产品卖到全世界。大家只需要知道:与中文相关的翻译服务将会不断产生新的价值。在这个过程中,翻译公司的作用将会不断被更多不同类型的商业服务所替代。传统的翻译公司还能在中国市场存活下去,但没有大钱可赚。包括翻译在内的高级语言服务将更有价值。
六、要深入挖掘数据中的洞见
翻译服务的上游是“数据”,下游也是“数据”。大部分的翻译公司单纯傻傻的输入数据输出数据,而不提供对数据的解读。咨询公司需要翻译服务、律师事务所需要翻译服务、公关公司需要翻译服务,但他们比翻译公司更能赚钱,原因就是他们能够从翻译完之后的数据中获取更多洞见,为客户提供更多价值,从而赚更多的钱。
如果你现在正在学习的是如何做翻译,那么你更应该学习的是如何在技术的辅助下快速做完翻译,然后在技术的帮助下更好的理解你产出的文本,从中发现更多的价值。
结语
写到这里,我把我看完TAUS报告的大部分所思所想都记录了下来。需要说明的是,这些不是报告里的内容,只是读完报告后瞎想的内容。
看完这个报告后,我给这篇文章起了一个耸人听闻的题目,这实际上是我对当今的翻译行业和翻译教育行业的担忧。因为,目前,这个行业给优秀技术人员的进入和先进技术的融合制造了很大很大的困难。“技术”对这个行业的人来说,永远是个看不透的“谜”。如果一个行业不从内向外突围,就只能被人从外到内侵蚀。
这个行业相当不缺“会说”的人,但万分欠缺“能做”的人。我的这些话只能写给还没有进入这个行业的学生们,因为只有你们开始改变,未来才会充满惊喜。
欢迎关注沙龙君个人账号