Source: http://bd.memect.com/archive/2015-09-25/long.html
使用 Spark MLlib 做 K-means 聚类分析
来自 @IBM_developerWorks 好东西传送门整理
关键词:分析, 计算框架, Spark
#最新文章推荐#“使用 Spark MLlib 做 K-means 聚类分析”,MLlib 是 Spark 生态系统里用来解决大数据机器学习问题的模块。本文将重点向您介绍如何使用 MLlib 机器学习库提供的 K-means 算法对数据做聚类分析。 [1] [1] http://www.ibm.com/developerworks/cn/opensource/os-cn-spark-practice4/
脱离JVM?Hadoop生态圈的挣扎与演化
来自 @云创大数据 好东西传送门整理
关键词:计算框架, Hadoop
【脱离JVM?Hadoop生态圈的挣扎与演化】Hadoop生态圈的各个项目,围绕着大数据的存储、计算、分析、展示、安全等各个方面,构建了完整的大数据生态系统,并有Cloudera,HortonWorks,MapR等数十家公司基于开源Hadoop平台构建自己的商业模式,可以说是近十年来最成功的开源社区。 [1] [1] http://www.cstor.cn/textdetail_9509.html
深入 HBase 架构解析
来自 @伯乐在线官方微博 好东西传送门整理
关键词:数据库, HBase
《 @雪地脚印_ :深入 HBase 架构解析(2)》通过前文的描述,我们知道在HBase写时,相同Cell(RowKey/ColumnFamily/Column相同)并不保证在一起,甚至删除一个Cell也只是写入一个新的Cell,它含有Delete标记,而不一定将一个Cell真正删除了,这就引起了一个问题,如何实现读的问题? [1] [1] http://blog.jobbole.com/91916/
Mesos上的复杂数据分析
来自 @InfoQ 好东西传送门整理
关键词:分析, 计算框架, 数据库, 虚拟化, Cassandra, Mesos, Spark
【Mesos上的复杂数据分析】本文探讨了使用运行在 Mesos 上的 Storm 和 Spark Streaming 处理实时和流数据的可选方案。也讲解了如何使用运行在 Mesos 上的 Cassandra 实现更多探索性数据分析。 [1] [1] http://www.infoq.com/cn/articles/mesos-complex-data-analytics
MongoDB、Cassandra 和 HBase 三种 NoSQL 数据库比较
来自 @伯乐在线官方微博 好东西传送门整理
关键词:计算框架, 数据库, Cassandra, Hadoop, HBase, MongoDB, NoSQL
《MongoDB、Cassandra 和 HBase 三种 NoSQL 数据库比较》Hadoop获得了许多大数据应用的信誉,但实际情况是,NoSQL数据库是一直处于更加广泛部署和更广泛的发展中的技术。 [1] ( @Hansion徐汉彬 译,欢迎加入翻译组: [2] ) [1] http://blog.jobbole.com/91923/
[2] http://group.jobbole.com/category/feedback/trans-team/
完整版
点此链接查看全部20条:http://bd.memect.com/archive/2015-09-25/long.html