python - 如何在结构主题建模 R 包中绘制文档主题分布？-6ren

python - 如何在结构主题建模 R 包中绘制文档主题分布？

转载作者：行者123 更新时间：2023-12-01 01:30:14

25

4

如果我使用 python Sklearn 进行 LDA 主题建模，我可以使用转换函数来获取 LDA 结果的“文档主题分布”，如下所示:

document_topic_distribution = lda_model.transform(document_term_matrix)

现在我也尝试了 R 结构主题模型 (stm) 包，我想要得到相同的结果。 stm包中是否有任何函数可以产生相同的东西(文档主题分发)？我创建了 stm 对象，如下所示:

stm_model <- stm(documents = out$documents, vocab = out$vocab,
                       K = number_of_topics, data = out$meta, 
                       max.em.its = 75, init.type = "Spectral" )

但我没有找到如何从这个对象中获得所需的分布。 documentation也没有真正帮助我。

最佳答案

正如 emilliman5 指出的，您的 stm_model 提供对模型底层参数的访问，如图 in the documentation 所示。。

事实上，theta 参数是一个

Number of Documents by Number of Topics matrix of topic proportions.

这需要一些语言解析:它是一个 N_DOCS by N_TOPICS 矩阵，即它有 N_DOCS 行，每个文档一个，并且 N_TOPICS 列，每个主题一列。这些值是主题比例，即如果 stm_model[1, ] == c(.3, .2, .5)，则意味着文档 1 为主题 1 的 30%，主题 2 为 20%， 50% 主题 3。

要找出哪个主题在文档中占主导地位，您必须找到最大值的(列!)索引，可以检索该索引，例如通过使用 MARGIN=1 调用 apply，这基本上表示“按行执行此操作”； which.max 只是返回最大值的索引:

apply(stm_model$theta, MARGIN=1, FUN=which.max)

关于python - 如何在结构主题建模 R 包中绘制文档主题分布？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/52948857/

25

4

0

文章推荐： python - 类变量的 Getter 或 Property 函数

文章推荐： jQuery 无法在 IE 7 和 Chrome 中工作

文章推荐： Jquery背景位置动画问题

文章推荐： javascript - 两种方法使用appendChild，但结果不同

eclipse 建模
我正在寻找可以从 Eclipse 的 UML 图生成代码的工具。该工具应该从 UML 图生成代码，进行逆向工程以查看代码更改，并提供合并选项以防止因任何更改而删除文件。是否有工具可以做到这一点，或者
UML 建模 - 在实践中它会在某个时候变成巫毒科学吗？
我正在寻找有关建模的见解。我有一个关于设计模式和基本类图、序列图和用例的介绍类(class)。我发现类图作为我编程中的组织工具非常宝贵。到目前为止，用例还算有用。本学期我正在上课，更深入地学习 U
json - 如何在Fluter上从Firestore中的模型json数据内部序列化/建模
如何使用 flutter 数据建模技术访问“HH”和“mm”。我一直在尝试按以下方式使用它，但是下面给出了错误。我的数据模型当前为它的简化版本。 class Week { final Strin
Neo4j 建模 - 按距离排序节点
我正在使用 Neo4j 和 PHP。在我的项目中，我有餐厅节点。每个节点都有纬度、经度和分类属性。我需要返回与用户给定分类相匹配的餐厅节点，其结果按距用户位置的距离排序(即第一个最近的餐厅)。最简
Java POJO 建模
我希望 POJO 包含一个 Status 字段(只有两个可能的值 SUCCESS、FAILED)，并且根据此状态，第二个字段需要为 POJO 对象(如果 Status 为 SUCCESS) 或只是字符
mysql 数据库规范化/建模
我正在尝试将我的办公室迁移到数据库应用程序中。这是我得到的: (来源:phunkei.de) 公司和个人从客户继承(1:1关系)。这是因为他们都可以是“客户”并收到账单，我想引用订单中的单个表。公司和
SQL 建模/查询问题
我目前有这个数据库结构: 一个条目可以有多个"file"、“文本”和“url”类型的项目。这些项目中的每一项在文本、网址或文件表(存储数据的位置)中都有一个对应的项目。我需要一个查询来有效地选择一
c++ - 用 "if"建模 "for"
下面的代码不应该像“if(condition)”语句一样工作吗，当它在另一个循环中并且“body”有自己的 break 或 continue 语句时，会出现明显的错误行为: for( ; condit
按计数对字符串进行排序的 Redis 建模
我一直在像这样存储和递增下载计数器: INCRBY downloads: 1 但现在我想要下载:* 按值排序，以便显示热门下载列表。我觉得我可以更好地存储它。我愚弄了: ZINCRBY downlo
nosql - Neo4j(或任何其他图形数据库)建模
我开始使用图形数据库，在我的团队中，我们已经开始为我们的软件建模图形。当我们尝试“记录”模型以查看数据库的结构时，问题就出现了。对于 SQL 数据库，您只需查看 SQL 模式。我们花了一些时间阅读
r - 使用面板数据进行 ARIMA 建模
我正在做一个固定效应回归并且遇到了自相关问题，为了解决这个问题，我正在使用预测、lmtest 和 plm 包进行 ARIMA 建模。我的数据是一般面板数据，looks like this ，我正在尝试
c - 建模 C 应用程序
我想知道是否有任何工具可以帮助我对 C 应用程序(即函数式编程)进行建模。例如。我目前正在构建一个共享库。但是为了直观地传达我的设计，我需要类似 UML 的东西。我想这样做，以便审查我的设计的人不需要
Json 到 Gson - 建模
我正在尝试将 JSON 转换为 GSON ，但我无法建模。谁能给我举个例子。 [ { "id": "1", "name": "lalala",
scala - 建模 optional 参数的最佳方法
正如标题所说，在中建模 optional 参数的最佳方法是什么？斯卡拉 ? 对于 optional 参数，我的意思是执行函数体不需要的值。要么因为该参数存在默认值，要么根本不需要该参数本身(例如配
functional-programming - 建模/记录功能程序
我发现 UML 可用于记录 OO 系统的各个方面，尤其是用于整体架构的类图和用于说明特定例程的序列图。我想为我的 clojure 应用程序做同样的事情。我目前对模型驱动开发不感兴趣，只是在交流应用程序
properties - 建模 DateTime 原始类型
我想知道是否有人知道如何使用 UML 在属性中建模 DateTime 基元类型？最佳答案我想这取决于日期的格式......请参阅下面的示例，其中我使用两个整数(分别为日和年)和一个名为“Month
java - 用于模型库测试的 UML 建模
我有一些与我的问题建模相关的问题。我正在研究基于模型的测试的论文项目。还想从专家的角度了解我是否采用正确的方法来建模我的场景。我正在对 Android 应用程序的 UI 进行建模，遍历它们，生成测试用
nosql - CouchDB 建模 - 时间过滤和分组数据
我正在尝试建立对 CouchDB 以及如何为某些现实世界场景建模数据的理解。我现在已经尽可能多地“按日期获取我的博客文章”；) 给定这样的文件: { "_id": "couch1",
rest - 使用层次结构对 REST 建模
一个模型资源是如何分层的？例如假设一个人有一个“留言板”并且“消息”是一种资源。假设“消息”可以有回复，从而形成一个讨论线程。如何模拟线程的概念？ “消息”是否包含它的子项？ “线程”是它自己的资源吗
java - 为我的类中使用的通用 pojo 建模
我正在尝试创建一个像通用 POJO 一样工作的对象，因为我必须通过不同的对象传递它，并且我需要一个接口(interface)来访问其属性。目前，我使用具有 getField 方法的基础对象来完成此操

首页

博学

6Ren·AI

商城

python - 如何在结构主题建模 R 包中绘制文档主题分布？