文章目录
- 主题建模
- 潜在迪利克雷分配(LDA)
- 一致性得分 coherence score
- 1. CV 一致性得分
- 2. UMass 一致性得分
- 3. UCI 一致性得分
- 4. Word2vec 一致性得分
- 5. 选择最佳一致性得分
主题建模
主题建模是一种机器学习和自然语言处理技术,用于确定文档中存在的主题。它能够确定单词或短语属于某个主题的概率,并根据它们的相似度或接近度对文档进行聚类。它通过分析文档中单词和短语的频率来实现这一目的。 主题建模的一些应用还包括文本摘要、推荐系统、垃圾邮件过滤器等。
具体来说,目前用于提取主题模型的方法包括潜狄利克特分配法(LDA
)、潜语义分析法(LSA
)、概率潜语义分析法(PLSA