gpt4 book ai didi

r - 如何让 R 显示字符向量中每个变量的频率?

转载 作者:行者123 更新时间:2023-12-04 17:52:36 26 4
gpt4 key购买 nike

我正在分析包含 181,000 多个用户操作的电子表格,并且想知道每个用户执行了多少操作。我想让 R 显示某个特定用户的名字出现了多少次,从高到低排序,这样我就可以专注于执行最多操作的用户(我们对执行十次操作的用户并不真正感兴趣,当我们最活跃的用户在过去一周执行了 101,554 次)。我创建了字符向量 new.variable.v 来选择电子表格的“screen_name”列,并且

table(table(new.variable.v))

显示计数,但不显示屏幕名称。我读过的所有其他解决方案似乎都适合识别特定实例出现的次数,而我想知道每个不同屏幕名称出现的次数。一位更精通 R 的 friend 提出了一些其他建议,这些建议是从我的控制台复制过来的,其中包含他们的错误消息:

new.variable.sort[order(new.variable.sort[,2], decreasing=TRUE),]

Error in [.default(new.variable.sort, , 2) : incorrect number ofdimensions

new.variable.order <- count(new.variable.v)

Error in UseMethod("group_by_") : no applicable method for'group_by_' applied to an object of class "character"

count(new.variable.v, x) %>%
arrange(desc(n))

Error in UseMethod("group_by_") : no applicable method for'group_by_' applied to an object of class "character"

我用谷歌搜索了这些错误并阅读了一些关于它们的其他 Stack Overflow 条目,但我未能产生成功的结果。

最佳答案

另一种 dplyr/tidyverse 风格的方法是首先使用 df <- readxl::read_excel() 将电子表格读入数据框.然后,您可以找到 screen_name 的计数:

res <- df %>%
group_by(screen_name) %>%
summarise(volume = n()) %>%
arrange(desc(volume))

我个人喜欢这种方法,因为我在 RStudio 工作,并将结果输出为数据框,让我可以轻松查看和使用它。

关于r - 如何让 R 显示字符向量中每个变量的频率?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43376169/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com