谷歌发布大型数据集合Wikilinks 可让程序更好地理解人类语言

2013年3月10日 | By News | Filed in: News.

http://www.cnbeta.com/articles/229171.htm
据外媒报道,谷歌于近日发布了一个大型数据集合–Wikilinks Corpus,它将可以帮助开发人员构建出可以准确解释人类语言的软件。Wikilinks Corpus中包含了来自各大网页及维基百科文章的4000多万条个人链接,它们则被称为mention。开发人员则可以通过分析每一条mention的内容以及目标文章的内容,进而确定一些模棱两可单词的意思。


发表评论

邮箱地址不会被公开。 必填项已用*标注