Source: http://ml.memect.com/archive/2016-02-09/long.html
12万标注过的Tweets语言检测数据集
来自 @王威廉 好东西传送门整理
关键词:经验总结, 博客
如何在社会媒体上做语言检测?没有数据怎么办?推特官方公布了一个十分难得的数据集:12万标注过的Tweets,有70种语言。推特官方数据下载: [1] [1] https://blog.twitter.com/2015/evaluating-language-identification-performance
【人工智能≠类人智能】超越图灵测试的世界观
来自 @新智元 好东西传送门整理
【人工智能≠类人智能】超越图灵测试的世界观 [1] [1] http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=402237730&idx=1&sn=18703b1e446e7ee04fb7d282762c1260&scene=0#wechat_redirect
谷歌:一种改进的PPMI矩阵分解学习word embeddings的方法
来自 @Wenpeng_Yin 好东西传送门整理
关键词:算法, 资源, 自然语言处理, PDF, 行业动态, 矩阵, 论文
谷歌又放出了一种改进的PPMI矩阵分解方法,来学习word embeddings,PK掉了word2vec/GloVe: “Swivel: Improving Embeddings by Noticing What’s Missing” [1] [1] http://arxiv.org/pdf/1602.02215v1.pdf
机器学习与认知系统
来自 @爱可可-爱生活 好东西传送门整理
关键词:Jorge Garcia
【机器学习与认知系统】《Machine Learning and Cognitive Systems》by Jorge Garcia Part 1: A Primer [1] Part 2: Big Data Analytics [2] Part 3: A ML Vendor Landscape [3] [1] http://dataofthings.blogspot.ca/2014/01/machine-learning-and-cognitive-systems.html
[2] http://dataofthings.blogspot.ca/2014/03/machine-learning-and-cognitive-systems.html
[3] http://dataofthings.blogspot.ca/2014/06/machine-learning-and-cognitive-systems.html
开源:(Python)基于SVM的统计依存分析器parzer
来自 @爱可可-爱生活 好东西传送门整理
关键词:算法, 自然语言处理, Python, SVM, 代码, 统计
【开源:(Python)基于SVM的统计依存分析器parzer】”Statistical Dependency Parser using SVM as proposed by Yamada et al” by Rohit Jain [1] [1] https://github.com/rohit-jain/parzer
完整版
点此链接查看全部25条:http://ml.memect.com/archive/2016-02-09/long.html