机器学习日报2016-02-09 12万标注过的Tweets语言检测数据集 等25条

2016年2月10日 | By News | Filed in: News.

Source: http://ml.memect.com/archive/2016-02-09/long.html

12万标注过的Tweets语言检测数据集

来自 @王威廉 好东西传送门整理

关键词:经验总结, 博客

如何在社会媒体上做语言检测?没有数据怎么办?推特官方公布了一个十分难得的数据集:12万标注过的Tweets,有70种语言。推特官方数据下载: [1] [1] https://blog.twitter.com/2015/evaluating-language-identification-performance

12万标注过的Tweets语言检测数据集

【人工智能≠类人智能】超越图灵测试的世界观

来自 @新智元 好东西传送门整理

【人工智能≠类人智能】超越图灵测试的世界观 [1] [1] http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=402237730&idx=1&sn=18703b1e446e7ee04fb7d282762c1260&scene=0#wechat_redirect

谷歌:一种改进的PPMI矩阵分解学习word embeddings的方法

来自 @Wenpeng_Yin 好东西传送门整理

关键词:算法, 资源, 自然语言处理, PDF, 行业动态, 矩阵, 论文

谷歌又放出了一种改进的PPMI矩阵分解方法,来学习word embeddings,PK掉了word2vec/GloVe: “Swivel: Improving Embeddings by Noticing What’s Missing” [1] [1] http://arxiv.org/pdf/1602.02215v1.pdf

机器学习与认知系统

来自 @爱可可-爱生活 好东西传送门整理

关键词:Jorge Garcia

【机器学习与认知系统】《Machine Learning and Cognitive Systems》by Jorge Garcia Part 1: A Primer [1] Part 2: Big Data Analytics [2] Part 3: A ML Vendor Landscape [3] [1] http://dataofthings.blogspot.ca/2014/01/machine-learning-and-cognitive-systems.html

[2] http://dataofthings.blogspot.ca/2014/03/machine-learning-and-cognitive-systems.html

[3] http://dataofthings.blogspot.ca/2014/06/machine-learning-and-cognitive-systems.html

机器学习与认知系统

开源:(Python)基于SVM的统计依存分析器parzer

来自 @爱可可-爱生活 好东西传送门整理

关键词:算法, 自然语言处理, Python, SVM, 代码, 统计

【开源:(Python)基于SVM的统计依存分析器parzer】”Statistical Dependency Parser using SVM as proposed by Yamada et al” by Rohit Jain [1] [1] https://github.com/rohit-jain/parzer

完整版

点此链接查看全部25条:http://ml.memect.com/archive/2016-02-09/long.html


发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注