文章: FAIR重磅发布大规模语料库XNLI:支持15种语言,解决跨语言理解难题

2018年10月13日 | By News | Filed in: News.

https://ift.tt/2OOwdfh

自然语言处理系统依赖于使用基于标注数据的有监督学习提高模型的处理能力。目前,许多模型是使用单一语言训练的,并不能直接应用于其他语言。鉴于收集每种语言的语料数据是不现实的,因此如何实现跨语言句子理解和低资源的跨语言迁移得到了越来越多的关注。XNLI论文进一步将多类型自然语言推理语料库的开发和测试集扩展到15种语言,其中甚至包括斯瓦希里语和乌尔都语等低资源语言,构建了一种用于XLU的基准测试数据集。

By 盖磊

IT.数码

via 未注册用户的 InfoQ 个性化 RSS Feed – 请注册后升级! http://www.infoq.com/cn

October 12, 2018 at 08:43AM


发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注