2019年自然语言处理( Natural Language Processing )的疯狂开局

2019-07-24 05:00:04 slator

本文共2391个字,阅读需6分钟

阅读模式 切换至双语

随着机器学习的迅速发展,自然语言处理( NLP )和生成( NLG )继续蓬勃发展.Slator 持续监控 NLP 和 NLG 作为机器翻译( MT )所属的总括类别,因为这些领域的发展最终可能会影响语言服务市场。 此外,机器翻译以及语言服务和技术与更广泛的人工智能和机器学习场景很好地结合在一起。例如,2019年1月,2019年应用机器学习日会议将人工智能和语言列为四大主要轨道之一。 在我们深入了解最新的 NLP 发布和资助之前,最近对 NLP 先驱的 MIT 技术评论访谈提供了一些急需的视角。 麻省理工学院( MIT )首席研究科学家鲍里斯•卡茨( Boris Katz )解释道:“如果你看一下机器学习的进展,所有的想法都是在20至25年前提出的。”卡茨是最早为 NLP 和 NLG 提供支持的研究人员之一。 根据 Katz 的说法,语言如此复杂,以至于今天大多数人认为智能的虚拟助手基本上是“只计算单词和数字”。 他进一步解释说,今天的技术已经赶上过去的想法。然而,向前迈进可能需要一种根本上新的办法。 Katz 举了两个例子。他说:“这本书不适合红色盒子,因为它太小了。”你想要一个聪明的机器人来理解这个盒子太小。然而,机器人应该知道这本书太大了。 但是今天的虚拟助手,甚至是最先进的 MT 引擎,都没有将代词与正确的先行词联系起来。 “前进的一条路是更好地理解人类的智能,然后利用这种理解来创建智能机器,” Katz 说。“人工智能研究需要建立在发展心理学、认知科学和神经科学的思想基础上,人工智能模型应该反映出人们已经知道的人类如何学习和理解世界。” 当然,因为 NLG 缺乏常识,并不意味着当前的技术没有通用的(有时甚至是非常令人印象深刻的)应用程序。在过去的四个星期里, Slator 经历了一些关于 NLP 和 NLG 的高调新闻。 更值得注意的新闻报道包括非盈利的人工智能研究公司 Elon Musk 和 Sam Altman 的脑筋, OpenAI 的新语言模型允许用户输入句子或短语,然后模型“预测”下一个单词应该是什么。从本质上讲,它从几个单词、一个短语或一个句子的初始输入中生成一个完整的故事。 这个名为 GPT-2的模型在接受了800万个网页内容的培训后,非常流利,以至于由于其可能被滥用而没有发布完整的模型。 在更实际的方面,基于 NLP 和 NLG 技术的新兴生态系统相当活跃。例如,印度最大的出口商 Reliance Industries 最近分两批以总计3750万美元的价格收购了 Revrie Language Technologies 。Revrie 主要关注印度语言,特别是印度22种方言的人机交互。 与此同时,谷歌还宣布了第二波在印度推出加速器项目的初创企业入围名单。其中一家初创公司 DheeYantra 是一家开发聊天机器人和 NLP 解决方案的公司,该解决方案涉及8种印度语言。据 Business Insider 称, DheeYantra 已经被辛迪加银行和印度管理学院 Ahmedabad 使用。 在中国, Tigerobo 公司从 Prospect Avenue Capital ( PAC )、 CreditEase Fintech Investment Fund 和高融资本获得了3300万美元的 A 系列融资。Tigerobo 是一家金融搜索引擎初创公司,其服务使用 NLP 。目前,该公司已筹集了近6000万美元的资本。 随着亚马逊 Alexa 的脚步,大型科技公司正进一步进军住宅、酒店和机场,甚至是联络中心。 今年1月,谷歌智能谷歌助理( Google Assistant )的口译模式演示是2019年消费者电子产品展( CES )的亮点之一,如今已正式面向家庭用户推出。谷歌最近在其智能显示屏上增加了持续的对话和解释模式。 在 CES 2019年揭幕这些功能的同时,谷歌宣布了与凯悦酒店( Hyatt Hotels )等公司合作的多语言礼宾服务试点项目。 三菱电气( Mitsubishi Electric )等公司最近宣布开发一个 NLP 系统,该系统可以促进10种语言的交流。朝日新闻( Asahi Shimbun )的一篇文章报道称,该系统将进行广泛测试,以评估“在繁忙地区和其他嘈杂环境中”广泛使用该系统的可行性。在机场信息板上展示和演示了一个原型,模拟了该系统可在哪些环境下运行。 所以 NLP 如果还没有进入我们的家庭、酒店和机场,就一定要去。很快, NLP 也会向公司接听我们的服务电话。 由 NLP 支持的会话平台 PolyAI 最近筹集了1200万美元在联络中心部署会话聊天机器人。Point72 Ventures 与 Sands Capital Ventures 、 Amadeus Capital Partners 、 Passion Capital 和 EntrepreneurFirst 共同参与了本轮融资。在此前一轮240万美元的种子融资之后,普立万迄今已筹集了1640万美元资金。 该公司的 CTO 坚持认为,他们的技术授权给人的代理,而不是取代他们,指出技术只是自动化和最大限度的联系中心过程。 在 AMLD2019, Oto 的创始人。ai 在演讲中解释了他们如何在 NLP 部署会话聊天机器人的最新进展的基础上开发一个系统。 最后,与 NLP 有关的最常被谈论的新闻之一是谷歌对 Linuvo 的开源,这是一个基于 TensorFlow 的序列对序列框架,特别是针对 NLP 的。 专家们称这是一种“受欢迎的工具”,但对研究人员的接受程度及其优势略有怀疑,而不是专门为了促进研究的开放性而捆绑在一起。至少在可预见的未来,灵活业界可能不会重组。但是有这个选择是很好的。

以上中文文本为机器翻译,存在不同程度偏差和错误,请理解并参考英文原文阅读。

阅读原文