Source: http://ml.memect.com/archive/2015-08-20/long.html
计算语义近期发展
来自 @iB37 好东西传送门整理
德国萨尔大学Universität des Saarlandes 10:分布式语义 [1] 11:隐变量模型 [2] 12:语境化的话题模型 [3] 众多阅读材料 [1] http://www.coli.uni-saarland.de/courses/comsem-10/page.php?id=schedule
[2] http://www.coli.uni-saarland.de/courses/comsem-11/page.php?id=schedule
[3] http://www.coli.uni-saarland.de/courses/comsem-12/page.php?id=schedule
ILSVRC2015发布数据
来自 @星空下的巫师 好东西传送门整理
关键词:视觉, 算法, GPU, 分类
ImageNet 2015的Scene classification竞赛任务已经发布数据了,高分辨率训练图像479GB,验证1.2GB,测试22GB,低分辨率256×256的训练图像109G,验证275MB,测试5.1GB,网速、硬盘和GPU缺一不可啊,网速2kb/s的路过 [1] [1] http://image-net.org/challenges/LSVRC/2015/
利用机器学习进行恶意代码分类
来自 @乌云知识库 好东西传送门整理
关键词:资源, Kaggle, 书籍, 特征工程
#技术分享# 近几年机器学习在安全届的应用越来越多,这次让我们看看它如何应用到恶意软件的分类上,感谢 @bindog 投稿的作品《利用机器学习进行恶意代码分类》, 通过Kaggle竞赛提供的500G数据集实战分析如何进行特征处理以及机器学习应用。 [1] @爱可可-爱生活 [1] http://drops.wooyun.org/tips/8151
《机器学习实践:测试驱动的开发方法》
来自 @成华区学无涯书社 好东西传送门整理
关键词:算法, HMM, KNN, SVM, 聚类, 神经网络, 书籍, 统计
每日新书:《机器学习实践:测试驱动的开发方法》面技术开发人员、CTO和咨询顾问人员,介绍了机器学习的基本原理,涵盖了测试驱动的机器学习、机器学习概述、K近邻分类、朴素贝叶斯分类、隐马尔科夫模型、支持向量机、神经网络、聚类、核岭回归、模型改进与数据提取等内容。
新词发现思路
来自 @陈阿荣 好东西传送门整理
关键词:自然语言处理
印象中的新词发现思路1. 词内高内聚,词间低耦合 2. 基于构件 3. 基于邻居 4. 天然词标注抽取,比如搜索日志,双引号,书名号,HTML 超链接等 5. 分词器的切碎字或自动新词识别(一般是基于字的标注) 6. 加入测试语料频率特征 7. 迭代式自增词典分词法 8. 无词典分词如最小描述长度 @chico2011
完整版
点此链接查看全部20条:http://ml.memect.com/archive/2015-08-20/long.html