Source: http://ml.memect.com/archive/2015-12-16/long.html
雅虎开源网络爬虫Anthelion
来自 @网路冷眼 好东西传送门整理
关键词:代码
【 Yahoo open sources Anthelion web crawler for parsing structured data】 [1] 雅虎开源网络爬虫Anthelion(幻日)用于分析结构化数据。Anthelion 是一个主要抓取语义数据的Nutch插件,以Apache License 2.0许可开源。 [1] https://github.com/yahoo/anthelion
博士论文+代码:高效的个性化PageRank算法
来自 @爱可可-爱生活 好东西传送门整理
关键词:算法, 应用, PageRank, 代码, 论文, 信息检索
【博士论文+代码:高效的个性化PageRank算法】《Efficient Algorithms for Personalized PageRank》P Lofgren [Stanford University] (2015) 线性代数+蒙特卡罗 实现速度显著改善的(双向随机游走)个性化PageRank算法(可用于搜索/推荐场景) [1] GitHub: [2] [1] http://arxiv.org/abs/1512.04633
[2] https://github.com/plofgren/bidirectional-random-walk
微软开源图数据库GraphView
来自 @微软亚洲研究院 好东西传送门整理
关键词:经验总结, 博客
【#开源#:图数据库GraphView】从金融欺诈检测到供应链管理,图数据正变得无处不在,而传统关系数据库被普遍认为在图数据管理上效率低下。今天,由微软亚洲研究院开发的图数据库GraphView 通过GitHub开源。它可以将关系数据库SQL Server及Azure SQL Database 转化为图数据库。 [1] [1] http://blog.sina.com.cn/s/blog_4caedc7a0102w2xg.html
BDTC 2015深度学习分论坛
来自 @视觉机器人 好东西传送门整理
关键词:会议活动, 深度学习, 视觉, 语音, 会议
【BDTC 2015】深度学习分论坛:DL的图像识别、语音识别应用进展及MxNet开源框架设计 [1] 介绍了: 基于深度学习的图像识别进度、Deep Learning在客服中心的应用、大规模特征哈希与深度网络压缩、场景文字识别的深度表示方法、开源深度学习框架MXNET解析 [1] http://www.csdn.net/article/2015-12-15/2826485#0-tsina-1-82961-397232819ff9a47a7b7e80a40613cfe1
刘洋研究组在Neural MT的baseline系统上的提高
来自 @刘群MT-to-Death 好东西传送门整理
关键词:算法, 自然语言处理, 机器翻译, 刘洋, 论文, 神经网络
清华大学刘洋研究组在Neural MT的baseline系统上采用Minimum Risk Training获得了约7.0BLEU值的提高: [1] 。了不起的工作! [1] http://arxiv.org/abs/1512.02433
完整版
点此链接查看全部28条:http://ml.memect.com/archive/2015-12-16/long.html