gpt4 book ai didi

r - 直方图主要显示零,但数据中没有零

转载 作者:行者123 更新时间:2023-12-04 10:40:45 25 4
gpt4 key购买 nike

我想生成我拥有的一些数据的直方图,但结果图的基数为 plot(hist())ggplot直方图函数主要显示零,计数数字对应于行数。实际数据中没有零,列是类integer .将类(class)更改为 numeric似乎没有任何效果。

数据如下所示:

> head(lengths)
gene size
1 0610005C13Rik 7381
3 0610009B22Rik 3249
4 0610009E02Rik 12071
7 0610009L18Rik 2512
8 0610010F05Rik 68682
11 0610010K14Rik 2710
> dim(lengths)
[1] 25230 2
> summary(lengths)
gene size
0610005C13Rik: 1 Min. : 20
0610009B22Rik: 1 1st Qu.: 4082
0610009E02Rik: 1 Median : 13768
0610009L18Rik: 1 Mean : 177473
0610010F05Rik: 1 3rd Qu.: 37702
0610010K14Rik: 1 Max. :163098416
(Other) :25224

根据 UCSC 的 refFLat table,这是一个非常简单的表格,由小鼠基因组中每个基因的转录长度组成。 summary()清楚地表明尺寸列中没有零。然而, plot(hist(lengths$size))ggplot(lengths) + geom_histogram(aes(size))将绝大多数值显示为零 - 似乎计数对应于数据中的条目数。

以下是 base 和 ggplot 的输出直方图函数,代码如下:
> plot(hist(lengths$size))
> plot(hist(subset(lengths, size>0)$size))
> ggplot(lengths, aes(size)) + geom_histogram() + ggtitle("Lengths")
`stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
> ggplot(subset(lengths, size>0), aes(size)) + geom_histogram() + ggtitle("Lengths, subset size>0")
`stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

enter image description here

base plot, subset size>0
ggplot
ggplot , subset size>0

抱歉链接,我是第一次发帖,没有足够的声誉来添加内嵌图像。

如您所见,即使绘制的数据子集不包含零,它仍然将数字的总数输出为零!我不明白如何解决这种行为,这对我来说完全是疯狂的。我确定我犯了一个简单的错误,但我似乎无法弄清楚。任何帮助将不胜感激。

再次,提前感谢任何人对我的难题的帮助。

编辑

我是个白痴,这只是超出了规模。感谢@Axeman 和@user26050。这是 log10 比例的绘图,使用以下代码:
> ggplot(lengths, aes(log10(size))) + geom_histogram() + ggtitle("Log10(size)")

log10 ggplot distribution

最佳答案

如果能提供数据框就好了。然后人们可以测试他们的答案并在这里发布他们的代码。
但是从您发布的内容来看,问题很明显。

直方图显示 号码 某个范围内的观察值。您有 25230 个观测值,我们看到在第一个 bin 中计数了 25000 多个。所以其他 bin 总共包含少于 230 个观测值,而且它们非常小——我们没有在这个规模上看到它们。

给你的建议:
1. 使用更多的垃圾箱。 ggplot 试图帮助您:stat_bin() using bins = 30. Pick better value with binwidth .您可以添加 binwidth=bins=geom_histogram选择参数以获得最佳可视化效果。例如,尝试 geom_histogram(bins=1000) .
2. 使用密度图。只需使用 geom_density()而不是 geom_histogram() .
3. 可能你只是想要一些其他的情节?

关于r - 直方图主要显示零,但数据中没有零,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59940894/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com