文章: 博客推荐系统: 基于内容相似性的推荐 ( 第二部分)

2016年5月11日 | By News | Filed in: News.

Source: http://www.infoq.com/cn/articles/blog-recommendation-system-part02?utm_campaign=infoq_content&utm_source=infoq&utm_medium=feed&utm_term=global

本文是博客推荐系统系列文章的第二篇。主要介绍了度量推荐结果相似度的两种方法,包括欧几里德距离和余弦相似法。还详细介绍了计算博客相似度时对博客文章向量化的三个步骤:分词、词频统计、加权。直接在这个向量化后的高维度空间中进行推荐效果不一定是最优的,通过使用SVD或PCA降维算法可以得到更好的推荐效果。文章的最后给出了推荐系统的实际运行效果的例子。

By 王庆


发表评论

邮箱地址不会被公开。 必填项已用*标注