大数据日报2015-06-25 怎样利用Spark Streaming和Hadoop实现近实时的会话连接 等28条

2015年6月28日 | By News | Filed in: News.

Source: http://bd.memect.com/archive/2015-06-25/long.html

怎样利用Spark Streaming和Hadoop实现近实时的会话连接

来自 @数盟社区 好东西传送门整理

关键词:计算框架, Hadoop, Spark

这里有个 Spark Streaming 样例是一个可持久化到Hadoop近实时会话的很好的例子。有兴趣的朋友不妨看看。 [1] [1] http://dataunion.org/19786.html

怎样利用Spark Streaming和Hadoop实现近实时的会话连接

通过Docker容器运行持续集成/持续部署

来自 @DockOne 好东西传送门整理

关键词:虚拟化, Docker, 容器

【通过Docker容器运行持续集成/持续部署】 对于docker主流的应用场景:持续集成和持续部署(CI/CD)大家也许并不陌生。这篇文章从独特的视角阐述了如何利用各种云平台构建属于自己的CI/CD容器,笔者还自己扩展了Gitlab CI引擎,对CI感兴趣的同学对这个文章应该很感兴趣。 [1] [1] http://dockone.io/article/468

通过Docker容器运行持续集成/持续部署

视频+资料:Spark Summit 2015专题

来自 @爱可可-爱生活 好东西传送门整理

关键词:分析, 计算框架, Spark

【视频+资料:Spark Summit 2015专题】《Spark Summit 2015: Data Science And Engineering At Scale》 [1] [1] https://spark-summit.org/2015/

视频+资料:Spark Summit 2015专题

基于HBase构建可伸缩的分布式事务队列

来自 @云创存储 好东西传送门整理

关键词:数据库, HBase

【基于HBase构建可伸缩的分布式事务队列】在 HBase 的帮助下,结合最佳实践,我们该如何创建了一个线性可伸缩的,分布式事务队列系统。一个实时流处理框架通常需要两个基础架构:处理器和队列。处理器从队列中读取事件,执行用户的处理代码,如果要继续对结果进行处理…… [1] [1] http://www.cstor.cn/textdetail_9113.html

基于HBase构建可伸缩的分布式事务队列

微软机器学习平台,让你在数据科学领域如虎添翼

来自 @微软亚洲研究院 好东西传送门整理

关键词:分析, 云服务, Azure

【微软机器学习平台,让你在数据科学领域如虎添翼】微软Azure机器学习平台通过简化网络服务创建、整合各类机器学习算法、用不断更新的数据反复训练模型等功能,在速度和精度上实现了数据分析和商业预测的颠覆性改变。同时,它也降低了机器学习的操作门槛,让更多人可用。详情>> [1] [1] http://www.msra.cn/zh-cn/research/machine-learning-group/announcing-the-general-availability-of-azure-machine-learning.aspx

微软机器学习平台,让你在数据科学领域如虎添翼

完整版

点此链接查看全部28条:http://bd.memect.com/archive/2015-06-25/long.html


发表评论

邮箱地址不会被公开。 必填项已用*标注