r - ggplot2 在使用自定义 x 轴限制绘制直方图时丢失数据-6ren

r - ggplot2 在使用自定义 x 轴限制绘制直方图时丢失数据

转载作者：行者123 更新时间：2023-12-03 09:07:23

25

4

我试图用 these data 绘制六个直方图(2 列数据(卡路里、钠)x 3 种类型(牛肉、肉类、家禽))我想给它们相同的 x 轴和 y 轴比例。我使用 scale_x_continuous 来限制 x 轴，根据各种来源，它会删除不会出现在绘图上的数据。这是我的代码:

#src.table is the data frame containing my data
histogram <- function(df, dataset, n_bins, label) {
  ggplot(df, aes(x=df[[dataset]])) + 
  geom_histogram(color="darkblue", fill="lightblue", bins = n_bins) + xlab(label)
}
src2_12.beef <- src2_12.table[src2_12.table$Type == "Beef",]
src2_12.meat <- src2_12.table[src2_12.table$Type == "Meat",]
src2_12.poultry <- src2_12.table[src2_12.table$Type == "Poultry",]

src2_12.calories_scale <- lims(x = c(min(src2_12.table$Calories), max(src2_12.table$Calories)), y = c(0, 6))
src2_12.sodium_scale <- lims(x = c(min(src2_12.table$Sodium), max(src2_12.table$Sodium)), y = c(0, 6)) 
#src2_12.calories_scale <- lims()
#src2_12.sodium_scale <- lims()

src2_12.plots <- list(
  histogram(src2_12.beef, "Calories", 10, "Calories-Beef") + src2_12.calories_scale,
  histogram(src2_12.meat, "Calories", 10, "Calories-Meat") + src2_12.calories_scale,
  histogram(src2_12.poultry, "Calories", 10, "Calories-Poultry") + src2_12.calories_scale,
  histogram(src2_12.beef, "Sodium", 10, "Sodium-Beef") + src2_12.sodium_scale,
  histogram(src2_12.meat, "Sodium", 10, "Sodium-Meat") + src2_12.sodium_scale,
  histogram(src2_12.poultry, "Sodium", 10, "Sodium-Poultry") + src2_12.sodium_scale
  )
multiplot(plotlist = src2_12.plots, cols = 2, layout = matrix(c(1, 2, 3, 4, 5, 6), nrow = 2, byrow = TRUE))

这是输出:

对比数据应该是什么样子:

我无法理解为什么缺少一些数据点，因为我设置的限制已经是数据的最小值和最大值。

最佳答案

您可能想使用 coord_cartesian 而不是 lims。当您摆弄直方图的限制时，可能会发生意想不到的事情，因为从原始数据到实际直方图必须进行相当多的繁琐转换。

让我们深入了解一个例子:

p <- ggplot(src2_12.beef,aes(x = Calories)) + 
  geom_histogram(bins = 10)
p1 <- ggplot(src2_12.beef,aes(x = Calories)) + 
  geom_histogram(bins = 10) + 
  lims(x = c(86,195))

a <- ggplot_build(p)
b <- ggplot_build(p1)

>a$data[[1]][,1:5]
   y count        x     xmin     xmax
1  1     1 114.1111 109.7222 118.5000
2  0     0 122.8889 118.5000 127.2778
3  3     3 131.6667 127.2778 136.0556
4  2     2 140.4444 136.0556 144.8333
5  5     5 149.2222 144.8333 153.6111
6  2     2 158.0000 153.6111 162.3889
7  0     0 166.7778 162.3889 171.1667
8  2     2 175.5556 171.1667 179.9444
9  3     3 184.3333 179.9444 188.7222
10 2     2 193.1111 188.7222 197.5000

> b$data[[1]][,1:5]
   y count         x      xmin      xmax
1  0     0        NA        NA  90.83333
2  0     0  96.88889  90.83333 102.94444
3  1     1 109.00000 102.94444 115.05556
4  0     0 121.11111 115.05556 127.16667
5  4     4 133.22222 127.16667 139.27778
6  4     4 145.33333 139.27778 151.38889
7  4     4 157.44444 151.38889 163.50000
8  1     1 169.55556 163.50000 175.61111
9  4     4 181.66667 175.61111 187.72222
10 2     2 193.77778 187.72222        NA
>

所以现在您想知道，这到底是怎么发生的，对吧？

好吧，当您告诉 ggplot 您需要 10 个 bin 并且 x 限制从 86 到 195 时，直方图算法会尝试创建跨越该实际范围的 10 个 bin。这就是为什么它尝试创建低于 100 个的 bin，即使那里没有数据。

然后可能会发生更多奇怪的情况，因为条形可能会超出标称数据范围(xmin 和 xmax 值)，因为条形宽度通常会略高于和略低于实际数据的高端和低端。

coord_cartesian 将在所有这些处理发生后调整 x 限制，因此它会绕过所有这些小怪癖。

关于r - ggplot2 在使用自定义 x 轴限制绘制直方图时丢失数据，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/46105803/

25

4

0

文章推荐： sql-server - 如何通过 DAO 传递查询从存储过程检索输出值

文章推荐： debezium - 了解 Debezium

文章推荐： r - 将多页 .pdf 合并到 RMarkdown 中

文章推荐： tmux - 如何设置按键绑定(bind)来切换 tmux 中的 Pane ？

Gnuplot 直方图
我使用为 .dat 文件中的一些数据创建了直方图 binwidth=... bin(x,width)=width*floor(x/width) plot 'file' using (bin($1,b
Kibana 直方图 - 单个图表上的多条参数化线
我需要能够在单个直方图上显示多条线，其中每条线都应该由一个参数表示。我有多个服务器，我想监控它们的 CPU 使用率。我的 Kibana 输入数据如下所示: 时间戳 |机器 |姓名 |值(value)
Kibana 直方图 - 在单个图表上绘制多个系列
我在 Elasticsearch 中有一个索引，它包含一个简单对象数组(键值，请参见下面的示例)。文档有时间戳。我可以在 Kibana 中为每个键值创建单独的直方图(即一个用于 bytes_sen
来自频率表的 R 直方图
所以我想出了如何将我的数据下钻到频率表 - Overall.Cond Freq 235 1 0 236 2 0 237
带框阴影的 gnuplot 直方图
我的目标是使用 gnuplot 5.4 框创建直方图，并用特定的 RGB 值对每个框进行着色(出于测试目的，它是“绿色”，但在最终数据集中将是 #RRGGBB) 我的数据如下所示: 5.800507
r - 具有可变宽度的重叠条形图/直方图
我有 chr totgenes FST>0.4 %FST>0.4 exFST>0.4 %exFST>0.4 inFST>0.4 %inFST>0.4 chrtotlen 1 14
带有误差条的 Matplotlib 直方图
我用 matplotlib 创建了一个直方图使用 pyplot.hist()功能。我想在条形图中添加 bin 高度 ( sqrt(binheight) ) 的毒物误差平方根。我怎样才能做到这一点？ .
具有多个种群的 R 直方图
我有兴趣在 R 中创建一个包含两个(或更多)人口的直方图，这意味着 - 我不希望两个直方图共享同一个图形，而是一个包含两种或更多颜色的条形图。找到下面的图片 - 这就是我想要完成的。有什么想法吗？
Gnuplot、跳过时间数据、直方图
所以，我需要按日期制作数据直方图，但我有 xticlabel 重叠的问题，所以，我试图找到一个解决方案，如何跳过 xtics 以避免重叠。考虑到日期不是整数抽动，我试图以这种方式解决它: .dat 文
histogram - 在grafana中显示每小时平均值(直方图)
给定每小时都有数据点的(电力)市场数据的时间序列，我想显示一个包含每小时数据的所有时间/时间范围平均值的条形图，以便分析师可以轻松地将实际价格与所有时间平均值进行比较(一天中哪个小时最贵/最便宜)。
scala - 直方图 - 以并行方式进行
+----+----+--------+ | Id | M1 | trx | +----+----+--------+ | 1 | M1 | 11.35 | | 2 | M1 | 3.4
Gnuplot、跳过时间数据、直方图
所以，我需要按日期制作数据直方图，但我有 xticlabel 重叠的问题，所以，我试图找到一个解决方案，如何跳过 xtics 以避免重叠。考虑到日期不是整数抽动，我试图以这种方式解决它: .dat 文
gnuplot:误解数据(直方图)
我有以下示例数据文件，我想在 gnuplot 中将其绘制为直方图 1 1 2 2 4 3 我正在使用以下命令绘制数据:用方框绘制“sample.data”，生成以下图表: ##
java - 随机数测试(直方图)
我是 Java 编码新手，我正在尝试使用提供给我的以下方法创建直方图。这些注释是对每个方法的说明，稍后我们将使用它们来创建主方法并打印直方图。我已经达到了方法 3，并且能够很好地编译所有内容，但我不确
php - 如何使用文本文件中获得的数据绘制实时图形(直方图)
我有一个由服务器上的程序生成的连续生成的数据(文本文件)。我想将数据绘制为实时图表，就像 powergrid做。这是我的方法: 由于数据是在服务器上以文本文件的形式连续生成的，因此我编写了一个 PHP
javascript - D3 直方图
我正在尝试通过一个函数使用 D3 创建一个简单的直方图。图表的 y 值作为数组传递给函数，然后函数创建 svg 和条形图。我得到了正确的轴，但条被切断了。似乎我的矩形 x 值太大而无法放入 svg
c# - Linq 直方图
有没有办法用 linq 做一个分段直方图？我见过几个示例，您可以在其中计算特定对象的出现次数。是否可以创建一个基于 linq 的直方图来计算两个值之间的一系列对象的出现次数？我不知道您将如何按一系列
java - 初学Java(直方图)
我正在参加初级 Java 类(class)，任务是创建一个具有以下输出的直方图程序:(100 和 10 是用户输入)。有多少个数字？ 100 间隔多少？ 10 Histogram ---------
iphone - 核心图 - 直方图
如何使用 corePlot 实现直方图。实际上，我正在尝试使用条形图。在条形图中是否有任何选项可以对我的值进行分组。例如:所以我只能打印 3 条。这样值应该像这样分组: X 0...5: B
MySQL根据值范围(直方图)进行任意分组的方法
我有一个简单的数据集，其中脚本需要时间来完成各个步骤。时间是不可预测的，但主要分组在特定的时间范围内，但我想以十分之一秒的分组来绘制图表。 (我知道这很奇怪，这是一些报告可视化内容的要求)。我可以将我

首页

博学

6Ren·AI

商城

r - ggplot2 在使用自定义 x 轴限制绘制直方图时丢失数据