Source: http://bd.memect.com/archive/2015-08-03/long.html
Hadoop Streaming原理简析
来自 @翟周伟 好东西传送门整理
关键词:计算框架, Hadoop
Hadoop Streaming原理简析 | 宅博客 HadoopStreaming框架主要是为了非Java程序员而设计的编程接口,streaming框架允许任何可以操作标准输入输出的编程语言在Hadoop平台中使用,通过使用这个编程接口可以很方便地将已有的程序向Hadoop平台移植。streaming的原理其实很简单,就是 [1] [1] http://t.jiathis.com/R7a62
约翰霍普金斯大学:数据科学课
来自 @CourseraChina 好东西传送门整理
关键词:分析, 书籍, 课程
【约翰霍普金斯大学:数据科学课】数据科学家的工具箱(中文版) [1] R 语言程序开发(中文版) [2] 获取和整理数据(中文版) [3] 探索性数据分析(中文版) [4] 可重复性研究 [5] 统计推断 [6] [1] https://www.coursera.org/course/datascitoolbox
[2] https://www.coursera.org/course/rprog
[3] https://www.coursera.org/course/getdata
[4] https://www.coursera.org/course/exdata
[5] https://www.coursera.org/course/repdata
[6] https://www.coursera.org/course/statinference
大数据与Hadoop之间是什么关系?
来自 @大数据资讯 好东西传送门整理
关键词:计算框架, Hadoop
【大数据与Hadoop之间是什么关系?】大数据在近些年来越来越火热,人们在提到大数据遇到了很多相关概念上的问题,比如云计算、 Hadoop等等。那么,大数据是什么、Hadoop是什么,大数据和Hadoop有什么关系呢? [1] [1] http://www.thebigdata.cn/Hadoop/14797.html
IBM如何拥抱Spark
来自 @InfoQ 好东西传送门整理
关键词:分析, 计算框架, Spark
【IBM如何拥抱Spark】日前,IBM宣布加入Spark社区,并与Spark的核心贡献公司Databricks合作。那么IBM将如何与社区进行合作,其自身又在Spark、大数据及机器学习领域有哪些计划?InfoQ受邀与IBM进行交流,并对以上问题进行了解读。 [1] 更多干货,请关注我们的公众账号geekbang01 [1] http://www.infoq.com/cn/articles/IBM-Spark
[YARN] MRAppMaster心跳原理
来自 @segmentfault:HackerShell 好东西传送门整理
关键词:计算框架, YARN
【[YARN] MRAppMaster心跳原理】博客原文 最近集群遇到一个问题,就是集群在跑任务的时候,AM会超时10min而被KILL,但任务重跑则成功,问题是随机的出现的, 所以初步怀疑是因为AM心跳汇报出现问题或则RM因为繁忙hang住,AM因为某些机制导致等待10min不汇报心跳 ,所以我们还是先了解,AM是如何向RM汇报心跳的。 在MRAppMaster中,ContainerAllocatorRouter负责向… [1] [1] http://segmentfault.com/a/1190000003043821
完整版
点此链接查看全部21条:http://bd.memect.com/archive/2015-08-03/long.html