菲利普·格林的讲话

2022-12-20 12:00:00 ELRC-欧洲语言资源协同化

本文共945个字,阅读需3分钟

阅读模式 切换至双语

尊敬的各位: 多好的一年,多好的十年! 我们知道,欧洲语言资源协调(ELRC)倡议现在即将结束,但它一直是欧洲正在形成的多语言数字生态系统的基石。 欧共体现在向公共部门、中小企业、非政府组织和学术界免费提供一套重要的最先进的语言技术工具。但是,只有使用干净、高质量的训练语言数据,才有可能实现高性能的语言技术。在成员国和CEF/DIGITAL联系国的支持下,ELRC在帮助收集和提供一系列语言的语言数据方面发挥了重要作用。 自ELRC于2014年6月启动以来,通过ELRC-SHARE存储库提供了3,306种语言资源。研究人员、开发人员、行政部门和语言专业人员从中受益,不仅努力保护数字濒危/较少使用的语言,而且帮助降低语言障碍,使人们更容易获得信息,即使在危机时期。当ELRC呼吁提供COVID-19特定文本数据时,或者当ELRC在战争开始后组织数据收集以构建乌克兰机器翻译时,人们的反应是多么奇妙。 6场会议和86场研讨会!欧洲幅员辽阔且多样化。环境法资源中心从未停止在国家、区域和地方各级促进多语种语言数据的收集。一些讲习班的出席人数创了记录,而与外地重大集会或欧盟理事会主席活动有关的会议极大地帮助提高了知名度,突出了语文数据和最新语文技术的重要性。 ELRC白皮书系列也是分享信息的绝佳媒介。最新的一个,“多语言欧洲的人工智能”,提供了宝贵的见解,在每个国家的语言资源的状态由ELRC解决。这些白皮书表明,语言数据的重要性没有得到所有成员国的平等承认。 未来是光明的,ELRC一直是其绘制的重要角色。根据数字欧洲计划,语言数据空间(LDS)项目将于2023年1月启动。这个项目将把ELRC的努力提升到一个新的水平,通过推进公共和私营部门的语言数据收集和交换,围绕语言数据创建一个完整的生态系统。 除了LDS之外,由于数字十年政策方案,我们还积极研究如何进一步同步和联合成员国使用语言数据的努力,例如,通过建立大型语言模型和支持规模经济。 最后但并非最不重要的是,在HORIZON欧洲方案下,刚刚发布了一项关于“高级语言技术中的自然语言理解和交互”的呼吁。 让我祝愿你们在今年年底休假期间一切顺利,并祝愿我们今后的努力一切顺利。 菲利普·格林 欧盟委员会DG/CONNECT负责人

以上中文文本为机器翻译,存在不同程度偏差和错误,请理解并参考英文原文阅读。

阅读原文