gpt4 book ai didi

r - Y轴随R中geom_density中的带宽而变化

转载 作者:行者123 更新时间:2023-12-01 08:09:00 25 4
gpt4 key购买 nike

据我了解,密度曲线下的面积应始终等于 1。这在 R 中似乎并非如此。

我的代码是这样的:

p <- ggplot() +
geom_density(data = data_plot, aes_string(x = "value", color = group_by),
position = "identity", size = 0.5, na.rm = TRUE) +
labs(x = data_plot$unit[data_plot[, group_by] == group_member[1]], y = "density") +
scale_colour_manual(values = color) +
theme_own()
plot(p)

当我将 geom_density 输入更改为

geom_density(data = data_plot, aes_string(x = "Wert", color = group_by),
position = "identity", size = 0.5, na.rm = TRUE, bw = bandwidth)

我在 y 轴上得到不同的值。

没有手动黑白:

No manual bw

体重 = 0.01:

Bw = 0.01

体重 = 0.00001:

Bw = 0.00001

我是不是理解错了什么?我确实希望 y 轴的范围随着带宽的增加而变大(因为许多值在 67 和 100),但曲线不应该更低吗?例如,在最后一张图中,面积约为 30(x 轴)*100(y 轴)=3'000。

最佳答案

的确,概率密度曲线下的总面积应该始终为 1。但是,此限制仍然允许 y 轴上的密度值超过 1,因为您必须乘以你感兴趣的密度区域与相应区域的宽度(通常通过求解积分来完成)

例如,考虑范围从 0 到 0.1 的均匀分布。此处,常数密度值为 10,因为 0.1 * 10 = 1。

# example: the shorter the interval between min and max, the larger the 
# the density value becomes
curve(dunif(x = x, min = 0, max = 0.1), from = 0, to = 0.1)

PDF of uniform distribution from 0 to 1

通过代码中的带宽参数,您实际上是在使感兴趣的区间越来越小,从而导致越来越高的密度值。

关于r - Y轴随R中geom_density中的带宽而变化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48442688/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com