r - QUANTEDA - 无效类 “dfmSparse” 对象-6ren

r - QUANTEDA - 无效类 “dfmSparse” 对象

转载作者：行者123 更新时间：2023-12-04 04:27:40

26

4

我收到此警告消息。我使用这些数据:

https://github.com/kbenoit/quanteda/tree/master/data/data_char_inaugural.RData

 library(quanteda)
 uk2010immigCorpus <- corpus(data_char_ukimmig2010, docvars = data.frame(party = names(data_char_ukimmig2010)),metacorpus = list(notes = "Immigration-related sections of 2010 UK party manifestos"))
 mydfm <- dfm(uk2010immigCorpus, remove = c("will", stopwords("english")),removePunct = TRUE)


 Error in validObject(.Object) : invalid class “dfmSparse” object: superclass "replValueSp" not defined in the environment of the object's class

QUANTEDA 有什么问题？

谢谢!伟大的

最佳答案

我通过安装 Matrix 库然后重新安装 quanteda 解决了这个问题，最后我重新启动了 R，现在 dfm 可以工作了。

install.packages("Matrix")
install.packages("quanteda")

关于r - QUANTEDA - 无效类 “dfmSparse” 对象，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/42025827/

26

4

0

文章推荐： hibernate - 如何使用 Criteria API 指定悲观锁？

文章推荐： asp.net-mvc - ASP.Net MVC 部分 View 保持其模型状态？

r - Quanteda:用字典中的引理替换标记的最快方法？
是否有比 R quanteda::tokens_lookup() 更快的替代方法？我使用“quanteda”R 包中的 tokens() 来标记包含 2000 个文档的数据框。每份文件为 50 -
通过正则表达式替换 quanteda token
我想明确替换 quanteda 包的 tokens 类对象中定义的特定标记。我未能复制适用于 stringr 的标准方法。目标是用 c("XXX", "of") 形式的两个标记替换 "XXXof"
r - Quanteda Kwic将数据附加到输出
我想将一些元数据附加到kwic输出中，例如客户ID(请参见下文)，以便可以轻松地对主文件进行查找。我尝试使用cbind附加数据，但没有正确匹配的内容。如果可能的话，将不胜感激。 docna
删除粘在类标记的 quanteda 对象的单词上的数字
相关问题可以在 here 中找到但不直接解决我在下面讨论的这个问题。我的目标是删除与 token 一起出现的任何数字。例如，我希望能够摆脱以下情况下的数字:13f , 408-k , 10-k等。我
r - Quanteda:如何删除我自己的单词列表
由于 Quanteda 中还没有现成的波兰语停用词实现，我想使用我自己的列表。我将其作为以空格分隔的列表形式保存在文本文件中。如果需要，我还可以准备一个以换行符分隔的列表。如何从我的语料库中删除自定
r - quanteda 字典中的逻辑组合
我正在使用 quanteda 字典查找。我将尝试制定可以查找单词逻辑组合的条目。例如: Teddybear = (fluffy AND adorable AND soft) 这可能吗？我只找到了一个
r - quanteda kwic 提取数字后跟百分比
我有一些文本包含包含数字的短语，后跟一些符号。我想提取它们，例如，数字后跟百分比。使用 quanteda 包中的 kwic 函数似乎适用于数字作为正则表达式(例如 "\\d{1,}")。尽管如此，我没
r - quanteda:带有新文本和旧词汇的 dtm
我使用 quanteda 来构建文档术语矩阵: library(quanteda) mytext = "This is my old text" dtm <- dfm(mytext, tolower=
r - 如何将字符向量列表转换为 quanteda 标记对象？
我有一个包含文档标记的字符向量列表。 list(doc1 = c("I", "like", "apples"), doc2 = c("You", "like", "apples", "too")) 我
r - 使用 Quanteda 语料库识别名词
我正在使用 Ken Benoit 和 Paul Nulty 的 quanteda 包来处理文本数据。我的语料库包含带有完整德语句子的文本，我只想处理每个文本的名词。德语中的一个技巧是只使用大写单词，
r - QUANTEDA - 无效类 “dfmSparse” 对象
我收到此警告消息。我使用这些数据: https://github.com/kbenoit/quanteda/tree/master/data/data_char_inaugural.RData RSt
r - quanteda:按行计算两个 DFM 之间的文本相似度
我有一个包含 2 个文本字段的数据框:评论和主要帖子基本上是这样的结构 id comment post_text
r - 如何使用 quanteda::tokens_select() 删除单字符和双字符标记
我正在尝试删除单字符和双字符标记。这是一个例子: toks <- tokens(c("This is a sentence. This is a second sentence."), remove
r - 如何使用 quanteda 进行命名实体识别 (NER)？
有一个带有文本的数据框 df = data.frame(id=c(1,2), text = c("My best friend John works and Google", "However he
r - 在 Quanteda 中使用字典创建 Bigram
我正在尝试从数据文本分析中删除拼写错误。所以我使用 Quanteda 包的字典功能。对于 Unigrams 来说效果很好。但它为 Biggram 提供了意想不到的输出。不知道如何处理拼写错误，以免它们
r - 使用 Quanteda 一步一步创建 dfm
我想分析一个大的(n=500,000)文档语料库。我使用 quanteda 期望 will be faster比 tm 中的 tm_map() 更好。我想逐步进行，而不是使用 dfm() 的自动化方式
r - 如何使用 quanteda::tokens_select() 删除单字符和双字符标记
我正在尝试删除单字符和双字符标记。这是一个例子: toks <- tokens(c("This is a sentence. This is a second sentence."), remove
r - 如何使用 quanteda 进行命名实体识别 (NER)？
有一个带有文本的数据框 df = data.frame(id=c(1,2), text = c("My best friend John works and Google", "However he
R:从 Quanteda DFM、稀疏文档特征矩阵、对象中删除正则表达式？
Quanteda 包提供了稀疏文档特征矩阵 DFM，其方法包含 removeFeatures .我试过 dfm(x, removeFeatures="\\b[a-z]{1-3}\\b")删除太短的单词
R. Quanteda 包。如何过滤 dfm_tfidf 中存在的值？
所以我有一个 dfm_tfidf 并且我想过滤掉低于某个阈值的值。代码: dfmat2 % as.dfm() #it works dfmat2 %>% dfm_trim(min_termfreq

首页

博学

6Ren·AI

商城

r - QUANTEDA - 无效类 “dfmSparse” 对象