gpt4 book ai didi

r - 如何将字符向量转换为 R 中 tm 包中 DocumentTermMatrix 函数的语料库输入?

转载 作者:行者123 更新时间:2023-12-04 10:37:13 24 4
gpt4 key购买 nike

我是新来的 tm包裹。我想用 DocumentTermMatrix函数来创建 DT-Matrix 以进行进一步的文本挖掘分析,但我能够为该函数创建适当的输入。

到目前为止,我的数据输入采用这样的字符向量格式,并尝试使用 as.VCorpus功能,但看起来它不起作用。代码如下:

> x <- as.VCorpus(sekcja_link$slowa_kluczowe_2)
Error in UseMethod("as.VCorpus") :
no applicable method for 'as.VCorpus' applied to an object of class "character"
> head(sekcja_link$slowa_kluczowe_2)
[1] "mandat policja zima kara"
[2] "sprzedaż samochodów w 2014 rok wzrost sprzedaży utrata prawa jazda wyprzedzać trzeci poduszka powietrzny"
[3] "kobieta 40stce powinien ruszać walczyć życie ewa minge kasia czaplejewicz fitness"
[4] "e booki książka elektroniczny papierowy czytnik amazon kindle książki rynek booków handel i usługi"
[5] "gra monopoly warszawa miasto plebiscyt samorząd i administracja"
[6] "rachunek za ogrzewać niższe koszt ogrzewać ciepło wiek dom mieszkać nieruchomości"
>

最佳答案

如果你有一个字符向量,你可以使用 VectorSource像这样:

txt <- c("Hello to you.", "Blah me, too.")
library(tm)
corp <- Corpus(VectorSource(txt))
dtm <- DocumentTermMatrix(corp)
# inspect(dtm)
# <<DocumentTermMatrix (documents: 2, terms: 5)>>
# Non-/sparse entries: 5/5
# Sparsity : 50%
# Maximal term length: 5
# Weighting : term frequency (tf)
#
# Terms
# Docs blah hello me, too. you.
# 1 0 1 0 0 1
# 2 1 0 1 1 0

关于r - 如何将字符向量转换为 R 中 tm 包中 DocumentTermMatrix 函数的语料库输入?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29209873/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com