gpt4 book ai didi

r - 为GGPlot2直方图中的X值以上的任何内容创建一个bin

转载 作者:行者123 更新时间:2023-12-04 11:41:30 25 4
gpt4 key购买 nike

使用ggplot2,我想创建一个直方图,其中X之上的任何内容都被分组到最终bin中。例如,如果我的大部分分布都在100到200之间,并且我想按10进行分箱,那么我希望将200以上的任何分箱都存储在“200+”中。

# create some fake data    
id <- sample(1:100000, 10000, rep=T)
visits <- sample(1:1200,10000, rep=T)

#merge to create a dataframe
df <- data.frame(cbind(id,visits))

#plot the data
hist <- ggplot(df, aes(x=visits)) + geom_histogram(binwidth=50)

如何在仍然代表我要限制的数据的同时限制X轴?

最佳答案

也许您正在寻找breaksgeom_histogram参数:

# create some fake data    
id <- sample(1:100000, 10000, rep=T)
visits <- sample(1:1200,10000, rep=T)

#merge to create a dataframe
df <- data.frame(cbind(id,visits))

#plot the data
require(ggplot2)
ggplot(df, aes(x=visits)) +
geom_histogram(breaks=c(seq(0, 200, by=10), max(visits)), position = "identity") +
coord_cartesian(xlim=c(0,210))

这看起来像这样(警告:假数据在这里看起来很差,并且还需要调整轴以匹配中断):

编辑:

也许其他人可以在这里称重:
# create breaks and labels
brks <- c(seq(0, 200, by=10), max(visits))
lbls <- c(as.character(seq(0, 190, by=10)), "200+", "")
# true
length(brks)==length(lbls)

# hmmm
ggplot(df, aes(x=visits)) +
geom_histogram(breaks=brks, position = "identity") +
coord_cartesian(xlim=c(0,220)) +
scale_x_continuous(labels=lbls)

绘图错误有:
Error in scale_labels.continuous(scale) : 
Breaks and labels are different lengths

看起来像 this,但已在8个月前修复。

关于r - 为GGPlot2直方图中的X值以上的任何内容创建一个bin,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11617411/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com