Source: http://bd.memect.com/archive/2015-10-14/long.html
揭秘Yahoo深度学习超级集群
来自 @爱可可-爱生活 好东西传送门整理
关键词:分析, 计算框架, Alex Woodie, Hadoop
【揭秘Yahoo深度学习超级集群】《Inside Yahoo’s Super-Sized Deep Learning Cluster》Alex Woodie “more than 600 petabytes of data spread across 40,000 Hadoop nodes” [1] [1] http://www.datanami.com/2015/10/12/inside-yahoos-super-sized-deep-learning-cluster/
如何将数据科学与商业结合起来
来自 @199IT-互联网数据中心 好东西传送门整理
关键词:分析
【如何将数据科学与商业结合起来】到底什么是数据,我们讲数据、决策、数据分析,什么是数据。其实数据是非常简单而优美的过程。关联了四个事物,一是人物,二是地点,三是交互的方法,中间完全关联再一个非常美妙的物理事实上就是时间。每一条数据,都是这种活动最基本的组合。 [1] [1] http://www.199it.com/archives/394177.html
数据科学中的 Spark 入门
来自 @外刊IT评论 好东西传送门整理
关键词:分析, 计算框架, Spark, 可视化
【数据科学中的 Spark 入门】Apache Spark 为数据科学提供了许多有价值的工具。随着 Apache Spark 1.3.1 技术预览版的发布,强大的 Data Frame API 也可以在 HDP 上使用数据科学家使用数据挖掘和可视化来帮助构造问题架构并对学习进行微调。Apache Zeppelin 正好能[…] [1] [1] http://www.techug.com/spark-introduction
统计学发展方向的选择
来自 @数说工作室网站 好东西传送门整理
关键词:分析, 物联网
【统计学发展方向的选择】认为统计学发展的未来,不是对现有大数据计算机技术(例如:并行计算)的盲目跟进。而应该是:学习并沉淀基于行业的业务知识,让统计学深入商业实践的各行各业(例如:物联网),为统计学的未来开疆拓土。 [1] [1] http://science.dataguru.cn/article-8261-1.html
搭建 etcd 集群 – 暴走漫画容器实践系列
来自 @segmentfault:Michael_Ding 好东西传送门整理
关键词:数据库, 虚拟化, etcd, 容器
【搭建 etcd 集群 – 暴走漫画容器实践系列 Part3】是一个高可用的分布式 key-value(键值) 存储系统。在暴漫我们用他用来做配置管理和服务发现。 这一次我们主要介绍关于 etcd 集群的搭建与管理。 1. etcd 集群概述 首先我们需要理解, 是一个分布式的 key-value 存储系统,所以其基本原理和前面我们介绍过的 是一致的。 两种不同的 node(节点) 值得注意的是,为了方便使用, … [1] [1] http://segmentfault.com/a/1190000003852735
完整版
点此链接查看全部17条:http://bd.memect.com/archive/2015-10-14/long.html