与Julien Nioche探讨基于Apache Storm的开源爬虫流水线 StormCrawler

2016年12月29日 | By News | Filed in: News.

http://ift.tt/2i8L5SJ

Julien Nioche是DigitalPebble公司的总监、PMC成员和Apache Nutch网络爬虫项目的代码提交者。StormCrawler是一组可重用的组件,可以构建基于流式框架Apache Storm的分布式网络爬虫。Julien Nioche就StormCrawler接受了我们的采访,谈了他的一些看法。Nioche是该项目的主要贡献者,InfoQ采访他以了解更多关于StormCrawler的情况,以及在相同领域内它与其他技术相比有什么特点。

By Alexandre Rodrigues Translated by 足下

IT.数码

via 未注册用户的 InfoQ 个性化 RSS Feed – 请注册后升级! http://ift.tt/rpkzfm

December 27, 2016 at 01:27AM


发表评论

电子邮件地址不会被公开。 必填项已用*标注