机器学习日报2015-08-17 词向量近期干货总结 等30条

2015年8月18日 | By News | Filed in: News.

Source: http://ml.memect.com/archive/2015-08-17/long.html

词向量近期干货总结

来自 @蒋振超 好东西传送门整理

关键词:自然语言处理

词向量近期干货总结 [1] 。第一个方向interpretable relations提到的文章仍然不是interpretable的,个人感觉词向量还有很大发展空间,因为目前离完美还差很远,连公共的评价标准还没统一出来 [1] http://mp.weixin.qq.com/s?__biz=MzAwMjM3MTc5OA==&mid=211976654&idx=1&sn=cb72a37f6c21c74d562c7a1dd387a3ff&scene=2&from=timeline&isappinstalled=0#rd

英语POS tagging工具FLORS

来自 @Wenpeng_Yin 好东西传送门整理

关键词:会议活动, 自然语言处理, EMNLP, 会议

顺着刚接收的EMNLP工作,我们发布了英语POS tagging工具FLORS. 亮点在于:1) 模型简单,训练容易,完全unsupervised;2)针对流式数据进行online tagging; 3)专门针对new domain的data,OOV上精度指标在原state-of-the-art上提升了3-6个百分点。请戳: [1] (页面不断完善中)[嘻嘻][哈哈] [1] http://cistern.cis.lmu.de/flors/

短文本摘要数据集

来自 @户保田 好东西传送门整理

关键词:会议活动, 深度学习, 自然语言处理, EMNLP, 会议, 教育网站

我们 @清才HIT 的emnlp2015的论文通过微博上的大量自然标注的数据,构建了一个超过200万的大规模的短文本摘要数据集, 并人工标注了超过1万个样本,使用RNN作为encoder 和 decoder 我们构造了一个完全依靠数据驱动的短文本文摘生成模型。相关数据下载地址以及详细信息请戳 [1] 。欢迎拍砖 [1] http://icrc.hitsz.edu.cn/Article/show/139.html

短文本摘要数据集

斯坦福NLU2015课程

来自 @iB37 好东西传送门整理

关键词:算法, 资源, 自然语言处理, 教育网站, 课程, 神经网络

斯坦福NLU2015课程,代码+数据。分布式词表示 关系提取 语义parsing 神经网络用于自然语言理解。众多工具和扩展阅读。 [1] [1] http://web.stanford.edu/class/cs224u/index.html

斯坦福NLU2015课程

整合信息理论与意识

来自 @闫安Jon 好东西传送门整理

关键词:算法, 神经网络

整合信息理论(Integrated Information Theory)指出,任何前馈(feed-forward)网络,即使输入输出完全达到人脑水平,也不可能具有意识,因此图灵测试有局限性。参考 [1] 段落5(g)。搞人工智能/机器学习/神经网络的同学们怎么看? [1] http://rstb.royalsocietypublishing.org/content/370/1668/20140167

完整版

点此链接查看全部30条:http://ml.memect.com/archive/2015-08-17/long.html


发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注