文章目录

        • 主题建模
        • 潜在迪利克雷分配(LDA)
        • 一致性得分 coherence score
          • 1. CV 一致性得分
          • 2. UMass 一致性得分
          • 3. UCI 一致性得分
          • 4. Word2vec 一致性得分
          • 5. 选择最佳一致性得分

主题建模

主题建模是一种机器学习和自然语言处理技术,用于确定文档中存在的主题。它能够确定单词或短语属于某个主题的概率,并根据它们的相似度或接近度对文档进行聚类。它通过分析文档中单词和短语的频率来实现这一目的。 主题建模的一些应用还包括文本摘要、推荐系统、垃圾邮件过滤器等。

具体来说,目前用于提取主题模型的方法包括潜狄利克特分配法(LDA)、潜语义分析法(LSA)、概率潜语义分析法(PLSA