大数据日报2015-06-12 论Spark Streaming的数据可靠性和一致性 等32条

2015年6月28日 | By News | Filed in: News.

Source: http://bd.memect.com/archive/2015-06-12/long.html

论Spark Streaming的数据可靠性和一致性

来自 @云创存储 好东西传送门整理

关键词:计算框架, 叶琪, Spark

【华为叶琪:论Spark Streaming的数据可靠性和一致性】Spark Streaming自发布起就得到了广泛的关注,然而作为一个年轻的项目,需要提升的地方同样很多,比如1.2之前版本driver挂掉可能会丢失数据。这里将分析它的可靠性机制。 [1] [1] http://www.cstor.cn/textdetail_9059.html

论Spark Streaming的数据可靠性和一致性

基于腾讯信鸽平台的手游流失用户预测模型概览

来自 @CSDN云计算 好东西传送门整理

关键词:分析, 应用

【基于腾讯信鸽平台的手游流失用户预测模型概览】借助大数据和机器学习做用户流失的预测分析是当前的一个应用趋势。此文介绍依托腾讯信鸽平台做手游用户的流失预测。文章着眼于数据、算法和系统三个方面,总结了一套手游通用的业务流失预测模型。本次流失预测的建模中采用了LR模型 [1] [1] http://www.csdn.net/article/2015-06-12/2824948

在PostgreSQL里使用JSON

来自 @湾区日报BayArea 好东西传送门整理

关键词:数据库, NoSQL

【在PostgreSQL里使用JSON】旧闻了:Postgres里支持JSON数据类型。但这仍是很激动人心的事情。NoSQL in PostgreSQL。 | 简评: [1] 原链: [2] #湾区日报# [1] http://wanqu.co/p/1140

[2] http://wanqu.co/r/87

Spark 1.4:SparkR发布,钨丝计划锋芒初露

来自 @CSDN云计算 好东西传送门整理

关键词:计算框架, Spark

【Spark 1.4:SparkR发布,钨丝计划锋芒初露】Spark 1.4版本正式发布,在Spark Core、Spark Streaming、Spark SQL(DataFrame)、Spark ML/MLlib等升级之外,新版本还加入了SparkR组件。下面一起看看SparkR和本次更新的介绍。 [1] [1] http://www.csdn.net/article/2015-06-12/2824945

Spark 1.4:SparkR发布,钨丝计划锋芒初露

Facebook如何向十亿人推荐东西

来自 @崔康总编 好东西传送门整理

近日,Facebook公布了其推荐系统的原理、性能及使用情况——使用Apache Giraph作为基础平台,工作原理方面采用的是流行的Collaborative filtering技术。实验显示,Facebook的系统比标准系统要快10倍左右。目前该方法已用于Facebook的多个应用中。 [1] [1] http://www.infoq.com/cn/news/2015/06/facebook-recommender-system

Facebook如何向十亿人推荐东西

完整版

点此链接查看全部32条:http://bd.memect.com/archive/2015-06-12/long.html


发表评论

电子邮件地址不会被公开。 必填项已用*标注