LinkedIn文本分析平台:主题挖掘的四大技术步骤

2016年7月30日 | By News | Filed in: 未分类.

Source: http://www.infoq.com/cn/news/2016/07/technical-details-for-topic?utm_campaign=infoq_content&utm_source=infoq&utm_medium=feed&utm_term=global

LinkedIn前不久发布两篇文章分享了自主研发的文本分析平台Voices的概览和主题挖掘的技术细节。在机器学习和自然语言处理等领域,主题挖掘是寻找是主题模型,主题模型是用来在一系列文档中发现抽象主题的一种统计模型。如果一篇文章有一个中心思想,那么一些特定词语会更频繁的出现。简单而言,主题挖掘就是要找到表达文章中心思想的主题词。

By Yongzheng (Tiger) Zhang Translated by 木环


Comments are closed here.