gpt4 book ai didi

r - 对分组变量求平均 geom_密度(y=..count..)

转载 作者:行者123 更新时间:2023-12-02 16:26:07 25 4
gpt4 key购买 nike

我使用以下方法绘制一些分布:

geom_density(aes(my.variable,
color=my.factor,
group=my.replicates,
y=..count..))

考虑到我在 my.factor 的每个级别中没有相同数量的重复,我想绘制重复的平均线(my.factor 的每个级别一条线)--> 我不能只删除“group”参数,因为 ..count.. 取决于重复次数。因此我想要类似 ..count../重复次数

这是上下文和可重现的示例

我在 2 个栖息地(a 和 b)进行了采样:每个鱼的数量和体型。我在栖息地之间进行了不同的采样工作。 (ra 和 rb 分别是在栖息地 a 和 b 内采样的重复样本数)我对栖息地之间鱼类丰度和体型的平均差异感兴趣。但是,我不知道如何处理我没有相同数量的副本这一事实。

数据

#number of replicat
ra=4;rb=6
#number of individuals (lambda of poisson distribution)
na=30;nb=60
#size of individuals (lambda of poisson distribution)
sa=90;sb=80

#data for habitat a
dfa=data.frame()
for (ri in 1:ra){
habitat="a"
nb_rep=ra
replicat=paste("r",ri,sep="")
size=rpois(rpois(1,na),sa)
dfa=rbind.data.frame(dfa,data.frame(habitat,nb_rep,replicat,size))
}
#data for habitat b
dfb=data.frame()
for (ri in 1:rb){
habitat="b"
nb_rep=rb
replicat=paste("r",ri,sep="")
size=rpois(rpois(1,nb),sb)
dfb=rbind.data.frame(dfb,data.frame(habitat,nb_rep,replicat,size))
}
#whole data set
df=rbind(dfa,dfb)

绘图

require(ggplot2)
summary(df)

密度

ggplot(df,aes(size,color=habitat))+
geom_density(aes(y=..density..))

计数

ggplot(df,aes(size,color=habitat))+
geom_density(aes(y=..count..))

但是,如果没有付出同样的努力对栖息地进行采样,那么这是有偏差的即不同数量的重复

计算,考虑不同的重复

ggplot(df,aes(size,color=habitat,group=paste(habitat,replicat)))+
geom_density(aes(y=..count..))

从最后一个图中,如何获得重复的平均线?谢谢

最佳答案

我认为你不能在ggplot中做到这一点。您可以自己计算密度,然后绘制计算出的密度。下面我通过使用 ggplot(df,aes(size,color=habitat)) + geom_密度(aes(y=..count..)) 重现已有的绘图来展示它实际上是有效的。 .

require(plyr)
# calculate the density
res <- dlply(df, .(habitat), function(x) density(x$size))
dd <- ldply(res, function(z){
data.frame(size = z[["x"]],
count = z[["y"]]*z[["n"]])
})
# these two plots are essentially the same.
ggplot(dd, aes(size, count, color=habitat)) +
geom_line()
ggplot(df,aes(size,color=habitat))+
geom_density(aes(y=..count..))

现在进行稍微困难的任务,即平均不同重复的密度。

# calculate the density 
res <- dlply(df, .(habitat), function(dat){
lst <- dlply(dat, .(replicat), function(x) density(x$size,
# specify to and from based on dat, not x.
from=min(dat$size),
to=max(dat$size)
))
data.frame(size=lst[[1]][["x"]],
#count=colMeans(laply(lst, function(a) a[["y"]]), na.rm=TRUE)*nrow(dat),
count=colMeans(laply(lst, function(a) a[["y"]]), na.rm=TRUE)*nrow(dat)/nlevels(droplevels(dat$replicat)),

habitat=dat$habitat[1])
})
dd <- rbindlist(res)
ggplot(dd, aes(size, count, color=habitat)) +
geom_line()

关于r - 对分组变量求平均 geom_密度(y=..count..),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22809562/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com