r - 输入矩阵的每一行需要包含至少一个非零项-6ren

r - 输入矩阵的每一行需要包含至少一个非零项

转载作者：行者123 更新时间：2023-12-01 13:25:53

26

4

我在运行这段代码时遇到了这个问题

text_lda <- LDA(text_dtm, k = 2, method = "VEM", control = NULL)

我有下一个错误“输入矩阵的每一行需要至少包含一个非零项”

然后我尝试用这些行来解决这个问题

row_total = apply(text_dtm, 1, sum)
empty.rows <- text_dtm[rowTotals == 0, ]$dimnames[1][[1]]

但我有下一期

cannot allocate vector of size 3890.8 GB

这是我的 DTM 的大小:

DocumentTermMatrix documents: 1968850, terms: 265238
Non-/sparse entries: 29766814/522184069486
Sparsity           : 100%
Maximal term length: 4000
Weighting          : term frequency (tf)

最佳答案

试试这个:

empty.rows <- text_dtm[rowTotals == 0, ]$dimnames[1][[1]] 
corpus_new <- corpus[-as.numeric(empty.rows)]

或者使用tm生成dtm然后:

ui = unique(text_dtm$i)
text_dtm.new = text_dtm[ui,]

关于r - 输入矩阵的每一行需要包含至少一个非零项，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59795421/

26

4

0

文章推荐： java - 在 else-if 循环中比较字符串和变量时出现问题

文章推荐： java - 文本文件到 jlabel 以及 jlabel 与文本文件的比较

文章推荐：按组别和年份之间的范围重叠/相交

Python Numpy 非零
所以我得到了这个形状为 (31641600,2) 的 numpy 数组，其中有一些零值，如果不是很多的话。我们称这个数组为 X。正在做: print len(X) >>> 31641600 然后做
iOS IBOutlet 非零，不知何故被清除为零
TL;DR:我有一个 IBOutlet ( UILabel ) 在 Storyboard 中正确连接。访问(展开)它在 viewDidLoad() 中工作正常...但几秒钟后它的值为零。一个观察点说，
Python numpy 非零 cumsum
我想用numpy数组进行非零cumsum。只需跳过数组中的零并应用 cumsum 即可。假设我有一个 np.数组 a = np.array([1,2,1,2,5,0,9,6,0,2,3,0]) 我的结
c - 为什么这会在终止时给出(非零)错误代码？
该代码运行，甚至产生预期的输出。但是，在构建日志中，我总是得到进程终止，状态为 2(0 分钟，5 秒) 或该日志的某些变体。代码- #include #include void main() { p
c - 非零 TCP 窗口比例选项的原因
我读了一些关于 TCP window scaling 的东西和 BDP (不太清楚)，我无法弄清楚到底是什么原因导致发送方的 TCP 实现设置非零 WS，用户模式客户端程序是否会以某种方式影响它？我认
python - 如何省略具有空(非零)值的键
我有一个字典 { 'a': 'a', 'b': 0, 'c': {} } 我需要省略所有具有空值的键(0 是不被认为是空的)。所以，它的输出应该是 { 'a': 'a', 'b': 0 }。对于 {
Python Pandas 非零 cumsum
我想在 python 中的 pandas 数据帧上应用 cumsum，但没有零。只是我想保留零并在数据帧上执行 cumsum 。假设我有这样的数据框: import pandas as pd df =
PHP 检查 IF 非空、非零
我使用 getimagesize 函数获取图像的宽度和高度，如下所示: list($width,$height) = getimagesize($source_pic); 如何使用 IF 条件来检查
PHP 仅显示有效(非零)小数
在 PHP 中(使用内置函数)我想用小数转换/格式化数字，以便只显示非零小数。但是，我的另一个要求是，如果它是一个没有十进制值的数字，我仍然希望显示为零。例子: 9.000 -> 9.0 9.100
pandas - NaN 的总和等于 NaN(非零)
我可以使用 df['TOTAL'] = df.sum(axis=1) 向此 DF 添加一个 TOTAL 列，它会像这样添加行元素: col1 col2 TOTAL 0 1.0 5.0
python - 删除 python 中的列表，getsizeof() 非零？
我正在玩 python 列表，我想在不使用列表时从内存中删除它。(我有大数据列表，可能有数千或数百万个元素..数据类型-> 浮点型) 我试过这段代码，看看删除在 python 中是如何工作的(示例)
linux - 如果列表不为空，list_empty 返回 1(非零)
我正在研究 Linux 设备驱动程序代码。我无法透露这段代码的具体用途。我会尽力解释我的情况。当我们收到 USB 中断，表明有来自 USB 的数据时，下面的代码将在中断上下文中执行。数据将以 URB
linux - Linux 功能如何与零/非零 UID 相关？
能力 manpage比较长，有些东西我没有完全理解。例如，决定我们是否有权访问 CAP_NET_RAW 的函数看起来如何？输入: a = 有效 uid 为 0 b = 有一些真实的/保存的/任何为
swift - 制作一个空白(非零)tviRoom 对象用于委托(delegate)功能测试
我正在创建一个测试用例，用于测试 TVIroom 类的委托(delegate)函数 didDisconnectwithError 是否可以被调用。为此，我需要向委托(delegate)函数传递一个空白
python - Numpy 非零/flatnonzero 索引顺序； bool 索引中返回元素的顺序
我想知道 numpy.nonzero/numpy.flatnonzero 返回的索引顺序。我在文档中找不到任何关于它的内容。它只是说: A[nonzero(flag)] == A[flag] 虽然在
python - 在每个 pandas 数据帧行中查找前 n 个最高值(非零)列的名称
假设我有这样的数据框 id p1 p2 p3 p4 1 0 9 0 4 2 0 0 0 4 3 1 3 10 7 4 1 5 3
Java- 非零 Int 除以 10 在 Float 中等于 0.0？
这个问题在这里已经有了答案: Division of integers in Java [duplicate] (7 个答案) 关闭 9 年前。我有一个音量控制 slider 来控制 Androi
html - "Elements should not have tabindex greater than zero"- 非零 Tabindex 破坏验证和 508 合规性
我们正在运行一个名为 Axe 的工具检查 HTML 页面的有效性和 508 合规性/可访问性。此错误作为违规出现: Elements should not have tabindex greater
ruby-on-rails - 在 Rails 中，使用 Mongoid，如何找到具有有效(非零)has_one 引用的所有模型？
所以我有两个这样的模型 class ModelParent include Mongoid::Document field :name, :type => String has_one :

首页

博学

6Ren·AI

商城

r - 输入矩阵的每一行需要包含至少一个非零项