Source: http://ml.memect.com/archive/2015-08-29/long.html
Twitter 和 Netflix的异常检测视频教程
来自 @hbyido 好东西传送门整理
关键词:经验总结, 算法, 资源, 博客, 幻灯片, 统计, 异常检测
【时间序列】【异常检测】【视频ppt】【Twitter】【Netflix】【NuPIC】 [1] [2] [3] [4] [1] http://blog.librato.com/posts/sf-metrics-meetup-anomaly-detection
[2] http://www.oscon.com/open-source-2015/public/schedule/detail/41265
[3] http://www.slideshare.net/arunkejariwal/statistical-learning-based-anomaly-detection-twitter
[4] http://www.slideshare.net/ZhanZhang3/anomaly-detection-45339969
标定移动APP的成人级别
来自 @iB37 好东西传送门整理
关键词:会议活动, 算法, 自然语言处理, CIKM, SVM, 行业动态, 会议
标定移动APP的成人级别。Mobile Apps: An Automatic Maturity Rating Framework [Hu,CIKM15] 特征:从APP的描述中,先抽取应用商店预定义的成人内容敏感词,然后word2vec增广这些敏感词。模型:用多标签分类(SVM),先预测成人内容归,然后再标定等级。数据:苹果和谷歌应用商店 [1] [1] http://binbenliu.github.io/
@也爱数据挖掘 数据挖掘系列 关联规则
来自 @伯乐在线官方微博 好东西传送门整理
关键词:经验总结, 算法, 博客
《数据挖掘(1):关联规则挖掘基本概念与Aprior算法》今天讲的是关联规则挖掘的最基本的知识。关联规则挖掘在电商、零售、大气物理、生物医学已经有了广泛的应用,本篇文章将介绍一些基本知识和Aprori算法。 [1] (作者: @也爱数据挖掘 ) [1] http://blog.jobbole.com/90121/
用Spark做大规模并行NLP
来自 @爱可可-爱生活 好东西传送门整理
关键词:架构, 自然语言处理, Jeff Palmucci, Spark
【用Spark做大规模并行NLP】《Using Apache Spark for Massively Parallel NLP》by Jeff Palmucci [1] [1] http://engineering.tripadvisor.com/using-apache-spark-for-massively-parallel-nlp/
文档图像除噪(去背景)教程
来自 @爱可可-爱生活 好东西传送门整理
关键词:视觉, 资源, Kaggle, 课程
【(R)Kaggle’s Denoising Dirty Documents竞赛文档图像除噪(去背景)教程】《Denoising Dirty Documents》Part1: [1] Part2: [2] [1] http://colinpriest.com/2015/08/01/denoising-dirty-documents-part-1/
[2] http://colinpriest.com/2015/08/07/denoising-dirty-documents-part-2/
完整版
点此链接查看全部23条:http://ml.memect.com/archive/2015-08-29/long.html