雅虎开源语义数据Web爬虫:Anthelion

2015年12月26日 | By News | Filed in: News.

Source: http://www.infoq.com/cn/news/2015/12/yahoo-open-source-anthelion?utm_campaign=infoq_content&utm_source=infoq&utm_medium=feed&utm_term=global

整个Web世界正在发生剧烈的转变,包含语义注解的Web页面让数据的提取和重用变得越来越容易,而为了提供更好的用户体验搜索引擎和社交媒体网站对这种数据的使用也越来越多。要获取这些数据离不开网络爬虫的支持,为此,Yahoo创建了Anthelion项目,一个旨在爬取语义数据的Nutch插件,最近,该项目已在GitHub上开源。

By 孙镜涛


发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注