Source: http://ml.memect.com/archive/2015-09-28/long.html
雅虎的大规模分布式深度学习
来自 @浩曦_Dorje 好东西传送门整理
关键词:架构, 深度学习, Hadoop, 分布式学习
内有干货!雅虎也开始深度学习了,大规模分布式深度学习。【Hadoop at Yahoo — Large Scale Distributed Deep Learning on Hadoop…】 [1] [1] http://fxt1.uc.cn/9_2dhPc
Reddit 2006~2015年全部提交语料库
来自 @网路冷眼 好东西传送门整理
关键词:经验总结, 自然语言处理, 经验
【Full Reddit Submission Corpus now available for 2006 thru August 2015】 [1] Reddit是个社交新闻站点,其2006~2015年全部提交语料库提供下载。压缩后大小42,674,151,378 字节,链接: [2] 转需! [1] https://www.reddit.com/r/datasets/comments/3mg812/full_reddit_submission_corpus_now_available_2006/
[2] http://reddit-data.s3.amazonaws.com/RS_full_corpus.bz2
让计算机识别视频中的静态物体和动作,并用语言描述
来自 @微软亚洲研究院 好东西传送门整理
关键词:经验总结, 算法, 博客, 论文
【动静之间,从视频到语言】能看懂视频的计算机离取代人眼还有多远?微软亚洲研究院多媒体搜索与挖掘组的研究成果>> [1] 能让计算机识别视频中的静态物体和动作,并用语言描述。该算法的表现取得了迄今全世界最好的实验成绩——也是目前学术圈公认的最好算法>> [2] [1] http://arxiv.org/abs/1505.01861
[2] http://blog.sina.com.cn/s/blog_4caedc7a0102vw32.html
基于Word2Vec/WMD的句子相似性计算
来自 @爱可可-爱生活 好东西传送门整理
关键词:架构, 自然语言处理, Spark
【(Spark)基于Word2Vec/WMD的句子相似性计算】《Sentence Similarity using Word2Vec and Word Movers Distance》by Sujit Pal [1] pdf: [2] 参阅:http://weibo.com/1402400261/CxI5Z1eCB [1] http://sujitpal.blogspot.com/2015/09/sentence-similarity-using-word2vec-and.html
[2] http://pan.baidu.com/s/1ntir085
概率主题模型算法综述
来自 @爱可可-爱生活 好东西传送门整理
关键词:算法, 资源, 自然语言处理, David M. Blei, PDF, 教育网站, 主题模型
【论文:概率主题模型(算法综述)】《Probabilistic Topic Models – Surveying a suite of algorithms that offer a solution to managing large document archives》David M. Blei (2012) [1] [1] https://www.cs.princeton.edu/~blei/papers/Blei2012.pdf
完整版
点此链接查看全部28条:http://ml.memect.com/archive/2015-09-28/long.html