gpt4 book ai didi

R:可视化大量群体之间的差异

转载 作者:行者123 更新时间:2023-12-02 00:13:37 26 4
gpt4 key购买 nike

I have a dataset具有制造单位的唯一 ID、其产出的行业分类 (CAT) 和每个单位雇用的人数 (EMP)。我想以图形方式显示 EMP 因 CAT 而异,即就业规模通常因单位生产的产出类型而异。我尝试了按 EMP 中位数排列的箱线图:

a = read.csv("/filepath/plot.csv", header=T, stringsAsFactors=F)
bymedian = with(a, reorder(CAT, log(as.numeric(as.character(EMP))), median))
boxplot(log(EMP) ~ bymedian, data=a, horizontal=F, notch=T, pch=1, cex=.25, col="gray95", boxwex=.25, las=2, outline=F)
pch=1, cex=.25, col="gray95", boxwex=.25, las=2, outline=F)

问题是因为类别太多(400+),剧情变得很乱。是否有更清晰的方式来展示我正在尝试做的事情?

最佳答案

使用 ggplot2 您可以显示您正在尝试使用 scale_x_discrete

enter image description here

library(ggplot2)
a$bymedian = with(a, reorder(CAT, log(EMP), median))
p <- ggplot(a,aes(y=log(EMP),x=bymedian))+
geom_boxplot()

breaks <- levels(a$bymedian)[seq(1,nlevels(a$bymedian),20)]
p %+% scale_x_discrete(breaks = breaks, labels = breaks)

关于R:可视化大量群体之间的差异,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14273248/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com