大数据日报2016-02-25 复制、分片和路由 等23条

2016年2月26日 | By News | Filed in: News.

Source: http://bd.memect.com/archive/2016-02-25/long.html

复制、分片和路由

来自 @segmentfault:xixicat 好东西传送门整理

关键词:数据库, NoSQL

【复制、分片和路由】分布式理论系列 序 本文主要讲述分布式nosql的两大特性:复制和分片。传统数据库采用纵向Scale Up的方式,即改善单机硬件资源配置来解决问题;主流大数据存储与计算系统采用横向Scale Out的方式,支持系统可扩展性,即通过增加机器来获得水平扩展能力。 对于海量数据,通过数据分片(shard/partition)来讲数据进行切分并分配到各个机器中去,数据分片后,如何能够找到某条记录的存储位置就成… [1] [1] https://segmentfault.com/a/1190000004485355

如何对应用程序的用户数据进行定量分析

来自 @数据分析精选 好东西传送门整理

【如何对应用程序的用户数据进行定量分析】数据科学关注查找噪声中隐藏的信号。这一点说起来容易做起来难,但无需依靠众多数据专家即可实现。本文介绍的定量分析技术是非常实用的入门方法(链接中提供额外信息),适用于想亲自使用基础统计技术的人员。 [1] [1] http://www.afenxi.com/post/8777

如何对应用程序的用户数据进行定量分析

Spark入门(Python)

来自 @cnblog:Vito.K 好东西传送门整理

关键词:计算框架, Hadoop, Spark

【Spark入门(Python)】【摘要】Hadoop是对大数据集进行分布式计算的标准工具,这也是为什么当你穿过机场时能看到”大数据(Big Data)”广告的原因。它已经成为大数据的操作系统,提供了包括工具和技巧在内的丰富生态系统,允许使用相对便宜的商业硬件集群进行超级计算机级别的计算。2003和2004年,两个来自Google的观点使H [1] [1] http://www.cnblogs.com/Vito2008/p/5216324.html

Docker发布Datacenter为用户提供容器云服务

来自 @Docker精选 好东西传送门整理

关键词:虚拟化, 云服务, Docker, 容器

【Docker发布Datacenter,为用户提供容器云服务】Docker Datacenter(简称DDC)的正式发布,企业将能够立足于内部或者虚拟私有云环境实现容器即服务(简称CaaS)的部署工作。这样开发人员可以以此为基础通过自助服务模式实现应用程序的构建与部署。 [1] [1] http://dockone.io/article/1046

Docker发布Datacenter为用户提供容器云服务

开源:(Yahoo)基于Hadoop/Spark的分布式Caffe实现CaffeOnSpark

来自 @爱可可-爱生活 好东西传送门整理

关键词:计算框架, Hadoop, Spark, 代码

【开源:(Yahoo)基于Hadoop/Spark的分布式Caffe实现CaffeOnSpark】GitHub: [1] 《CaffeOnSpark Open Sourced for Distributed Deep Learning on Big Data Clusters | Hadoop at Yahoo》 [2] [1] https://github.com/yahoo/CaffeOnSpark

[2] http://yahoohadoop.tumblr.com/post/139916563586/caffeonspark-open-sourced-for-distributed-deep

开源:(Yahoo)基于Hadoop/Spark的分布式Caffe实现CaffeOnSpark

完整版

点此链接查看全部23条:http://bd.memect.com/archive/2016-02-25/long.html


发表评论

电子邮件地址不会被公开。 必填项已用*标注