大数据日报2016-05-14 word2vec踩的无数工程坑总结 等18条

2016年5月15日 | By News | Filed in: News.

Source: http://bd.memect.com/archive/2016-05-14/long.html

word2vec踩的无数工程坑总结

来自 @phunter_lau 好东西传送门整理

我来把我用word2vec踩的无数工程坑总结一下,多是关于速度,请观众朋友补充+拍砖+分享自己的人生经验。1. CPU实现gensim号称速度和C语言版本的word2vec差不多甚至更快,但是作者只在四核i7的笔记本上测试… [1] [1] http://weibo.com/p/1001603974934580865719

Airbnb是如何利用大数据帮助用户确定房租价格的?

来自 @199IT-互联网数据中心 好东西传送门整理

关键词:分析

【Airbnb是如何利用大数据帮助用户确定房租价格的?】为了帮助房主们定价,Airbnb开发了一套叫“Aerosolve”的机器学习平台。自动将城市划分成无数个由微型街区组成的小区域,并分析房主们拍摄的房间照片。Aerosolve还模仿酒店和航空公司的定价模式搭建了一套动态定价策略。 [1] [1] http://www.199it.com/archives/471911.html

Airbnb是如何利用大数据帮助用户确定房租价格的?

基于spark streaming 的一套流式机器学习库

来自 @祝威廉二世 好东西传送门整理

关键词:分析, 计算框架, Spark, 代码

基于spark streaming 的一套流式机器学习库 可以整合进StreamingPro 这些也作为模块可以配置『GitHub – huawei-noah/streamDM: Stream Data Mining Library for Spark Streaming』 [1] [1] https://github.com/huawei-noah/streamDM

知道 Hadoop 就够了?这九大技术你也必须了解!

来自 @稀土圈 好东西传送门整理

关键词:计算框架, Hadoop

[2] 知道 Hadoop 就够了?这九大技术你也必须了解! – Hadoop 是大数据领域最流行的技术,但并非唯一。还有很多其他技术可用于解决大数据问题。除了 Apache Hadoop 外,另外 9 个大数据技术也是必须要了解的。分享by @阿里百川 详戳→ [2] [1] http://gold.xitu.io/#/entry/57335edf79bc44005c2cfd94

[2] http://gold.xitu.io/#/entry/57335edf79bc44005c2cfd94

长微博图:http://ww1.sinaimg.cn/large/005SiNxygw1f3ua8v4euvj30af6907vm.jpg

用实例讲解Spark Sreaming

来自 @爱可可-爱生活 好东西传送门整理

关键词:计算框架, Spark

《用实例讲解Spark Sreaming》by 侠天 via: @InfoQ [1] [1] http://www.infoq.com/cn/articles/spark-sreaming-practice

用实例讲解Spark Sreaming

完整版

点此链接查看全部18条:http://bd.memect.com/archive/2016-05-14/long.html


发表评论

邮箱地址不会被公开。 必填项已用*标注