机器学习日报2015-12-16 雅虎开源网络爬虫Anthelion 等28条

2015年12月18日 | By News | Filed in: News.

Source: http://ml.memect.com/archive/2015-12-16/long.html

雅虎开源网络爬虫Anthelion

来自 @网路冷眼 好东西传送门整理

关键词:代码

【 Yahoo open sources Anthelion web crawler for parsing structured data】 [1] 雅虎开源网络爬虫Anthelion(幻日)用于分析结构化数据。Anthelion 是一个主要抓取语义数据的Nutch插件,以Apache License 2.0许可开源。 [1] https://github.com/yahoo/anthelion

雅虎开源网络爬虫Anthelion

博士论文+代码:高效的个性化PageRank算法

来自 @爱可可-爱生活 好东西传送门整理

关键词:算法, 应用, PageRank, 代码, 论文, 信息检索

【博士论文+代码:高效的个性化PageRank算法】《Efficient Algorithms for Personalized PageRank》P Lofgren [Stanford University] (2015) 线性代数+蒙特卡罗 实现速度显著改善的(双向随机游走)个性化PageRank算法(可用于搜索/推荐场景) [1] GitHub: [2] [1] http://arxiv.org/abs/1512.04633

[2] https://github.com/plofgren/bidirectional-random-walk

博士论文+代码:高效的个性化PageRank算法

微软开源图数据库GraphView

来自 @微软亚洲研究院 好东西传送门整理

关键词:经验总结, 博客

【#开源#:图数据库GraphView】从金融欺诈检测到供应链管理,图数据正变得无处不在,而传统关系数据库被普遍认为在图数据管理上效率低下。今天,由微软亚洲研究院开发的图数据库GraphView 通过GitHub开源。它可以将关系数据库SQL Server及Azure SQL Database 转化为图数据库。 [1] [1] http://blog.sina.com.cn/s/blog_4caedc7a0102w2xg.html

微软开源图数据库GraphView

BDTC 2015深度学习分论坛

来自 @视觉机器人 好东西传送门整理

关键词:会议活动, 深度学习, 视觉, 语音, 会议

【BDTC 2015】深度学习分论坛:DL的图像识别、语音识别应用进展及MxNet开源框架设计 [1] 介绍了: 基于深度学习的图像识别进度、Deep Learning在客服中心的应用、大规模特征哈希与深度网络压缩、场景文字识别的深度表示方法、开源深度学习框架MXNET解析 [1] http://www.csdn.net/article/2015-12-15/2826485#0-tsina-1-82961-397232819ff9a47a7b7e80a40613cfe1

BDTC 2015深度学习分论坛

刘洋研究组在Neural MT的baseline系统上的提高

来自 @刘群MT-to-Death 好东西传送门整理

关键词:算法, 自然语言处理, 机器翻译, 刘洋, 论文, 神经网络

清华大学刘洋研究组在Neural MT的baseline系统上采用Minimum Risk Training获得了约7.0BLEU值的提高: [1] 。了不起的工作! [1] http://arxiv.org/abs/1512.02433

完整版

点此链接查看全部28条:http://ml.memect.com/archive/2015-12-16/long.html


发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注