gpt4 book ai didi

r - 使用箱线图对大型数据集进行可视化

转载 作者:行者123 更新时间:2023-12-02 02:39:00 24 4
gpt4 key购买 nike

我有以下格式的数据框。

item    price
item1 23
item2 45
item1 24
item3 98
item2 45.9
item3 97.2

据此,我需要在项目列中显示每个唯一项目的价格分布箱线图。大约有 80 种独特的元素。所以,我不确定如何对它们进行分组,以便我得到至少有 4 个独特项目及其在每个图表中的范围的箱线图,以及所有 80 个独特项目的多个这样的图表。我不确定我是否应该 reshape 我的数据框,即使我需要,它的基础是什么?我试过 facet_wrap 但 nrow 没有任何区别。对此的任何帮助将不胜感激。

提前致谢。

最佳答案

您需要根据项目名称创建一个分组变量。由于示例中的所有项目都称为 item#,我只是从它们中提取数字以进行分组 var:

df <- df %>%
mutate(group = gsub("item", "", item))

p <- ggplot(df, aes(x=item, y=price)) +
geom_boxplot() +
facet_wrap(item~group,scales="free")
p

关于r - 使用箱线图对大型数据集进行可视化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60952188/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com