gpt4 book ai didi

r - R 中的词云来自值列表(不是来自文本文档)

转载 作者:行者123 更新时间:2023-12-02 14:37:49 24 4
gpt4 key购买 nike

我已经根据这样的标准对文本中的标记进行了排名,并且它们都有一个值。我的列表如下所示:

value,token
3,tok1
2.84123,tok2
1.5,tok3
1.5,tok4
1.01,tok5
0.9,tok6
0.9,tok7
0.9,tok8
0.81,tok9
0.73,tok10
0.72,tok11
0.65,tok12
0.65,tok13
0.6451231,tok14
0.6,tok15
0.5,tok16
0.4,tok17
0.3001,tok18
0.3,tok19
0.2,tok20
0.2,tok21
0.1,tok22
0.05,tok23
0.04123,tok24
0.03,tok25
0.02,tok26
0.01,tok27
0.01,tok28
0.01,tok29
0.007,tok30

然后我尝试使用以下代码生成词云:

library(tm)
library(wordcloud)

tokList = read.table("tokens.txt", header = TRUE, sep = ',')

# Create corpus
corp <- Corpus(DataframeSource(tokList))
corpPTD <- tm_map(corp, PlainTextDocument)

wordcloud(corpPTD, max.words = 50, random.order=FALSE)

产生:

enter image description here

但这不是我想要的。我想要一个词云,在其中根据 table 。因此,如果第一个标记有 3,那么我希望该单词比列表中下一个元素大三倍。

有人可以帮忙吗?

最佳答案

简单来说,这也可以工作(假设您的最小值不为零,如果为零则过滤掉相应的标记):

library(RColorBrewer)
wordcloud(tokList$token, tokList$value/min(tokList$value), max.words = 50, min.freq = 1,
random.order=FALSE, colors=brewer.pal(6,"Dark2"), random.color=TRUE)

enter image description here

关于r - R 中的词云来自值列表(不是来自文本文档),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42054467/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com