gpt4 book ai didi

r - 使用 ggplot 绘制时间标签覆盖率

转载 作者:行者123 更新时间:2023-12-02 02:08:05 25 4
gpt4 key购买 nike

我正在尝试重现一个情节,该情节可视化一组电子标签的时间跨度,但收效甚微。我附上了一个简单的例子,说明了我想要生成的图表类型以及构成该图表的数据。任何使用 ggplot 生成此图的帮助都会非常有帮助。

请注意,在图中我不关心年份,我只是想可视化标签记录数据的日期和月份。另请注意,对于像 4120 这样在今年年底(九月)推出并持续生成数据直到下一年年初(四月)的标签,该条形图会持续到年底,然后有另一个条形图从一月开始,可视化标签记录的其余部分。

dat <- structure(list(Tag_Num = c(44386L, 44387L, 44388L, 44390L, 52236L, 
52237L, 52238L, 60639L, 60641L, 61921L, 61925L, 61932L, 61936L,
61938L, 61940L, 61957L, 63975L, 63977L, 87565L, 100949L), Deploy = structure(c(1L,
3L, 2L, 9L, 5L, 7L, 14L, 6L, 4L, 13L, 15L, 20L, 10L, 12L, 8L,
19L, 16L, 11L, 18L, 17L), .Label = c("5/4/2004", "5/5/2004",
"5/6/2004", "6/22/2011", "6/24/2005", "6/24/2011", "6/26/2005",
"6/30/2006", "7/3/2004", "9/1/2006", "9/10/2007", "9/11/2007",
"9/12/2006", "9/15/2007", "9/21/2006", "9/22/2006", "9/24/2010",
"9/6/2008", "9/7/2006", "9/9/2006"), class = "factor"), Recover = structure(c(14L,
14L, 14L, 2L, 18L, 17L, 3L, 16L, 15L, 7L, 4L, 12L, 9L, 6L, 13L,
8L, 5L, 11L, 1L, 10L), .Label = c("12/20/2008", "12/31/2004",
"3/14/2008", "3/21/2007", "4/18/2007", "5/12/2008", "5/15/2007",
"5/16/2007", "5/21/2007", "5/22/2011", "5/8/2008", "5/9/2007",
"7/26/2006", "9/10/2004", "9/20/2011", "9/22/2011", "9/25/2005",
"9/8/2005"), class = "factor")), .Names = c("Tag_Num", "Deploy",
"Recover"), class = "data.frame", row.names = c(NA, -20L))

该图不再与上面的数据集匹配,但仍然给出了我想要完成的任务的示例。

enter image description here

最佳答案

我找到了一个解决方案,尽管我最终依靠朱利安日期来使其发挥作用。我严重依赖 lubridate、dplyr 和 ggplot2 软件包。

我花了很长时间来弄清楚数据集应该是什么样子。如果您只有这五个点,您可以轻松地为 4120 创建第二行。这是一种使用 dplyr 中的 do 在整个数据集上执行此操作的方法。

require(dplyr)
require(lubridate)

dat2 = dat %>%
group_by(Tag_Num) %>%
do(if(year(mdy(.$Deploy)) - year(mdy(.$Recover)) != 0) {
data.frame(Deploy = c(as.character(.$Deploy), paste("1/1", year(mdy(.$Recover)), sep = "/")),
Recover = c(paste("12/31", year(mdy(.$Deploy)), sep = "/"), as.character(.$Recover))) }
else { data.frame(Deploy = .$Deploy, Recover = .$Recover) } )

现在数据集看起来像:

  Tag_Num    Deploy    Recover
1 4001 1/1/2014 9/1/2014
2 4120 9/1/2013 12/31/2013
3 4120 1/1/2014 4/20/2014
4 4356 1/1/2011 6/29/2011
5 4665 3/15/2010 10/17/2010

我将实际绘图转换为儒略日部署和恢复日期。我还输入了部署年份,因此从技术上讲,您可以在图中按年份进行颜色之类的操作。

dat2 = dat2 %>% ungroup %>% 
mutate(year = year(mdy(Deploy)), JDeploy = yday(mdy(Deploy)),
JRecover = yday(mdy(Recover)), Tag_Num = factor(Tag_Num))
  Tag_Num    Deploy    Recover year JDeploy JRecover
1 4001 1/1/2014 9/1/2014 2014 1 244
2 4120 9/1/2013 12/31/2013 2013 244 365
3 4120 1/1/2014 4/20/2014 2014 1 110
4 4356 1/1/2011 6/29/2011 2011 1 180
5 4665 3/15/2010 10/17/2010 2010 74 290

为了将月份而不是儒略日放在 x 轴上,我计算出了每个月中间的近似儒略日,以用作轴中断。这对我来说似乎有点老套,但不确定如何定义中断。

# Make breaks in Julian Day that will be equivalent to essentially midmonth?
xbreaks = yday(paste(2013, 1:12, c(15, 14, rep(15, 10)), sep = "-"))
# If want labels at start of each month rather than midmonth
xbreaks2 = yday(paste(2013, 1:12, 1, sep = "-"))

然后用ggplot2绘图。这依赖于在 geom_segment 中使用的因子 Tag_Num 上使用 as.numeric。然后使用 Tag_Num 级别设置 y 轴中断标签。您可以通过更改数据集中 Tag_Num 级别的顺序来更改 y 轴的顺序。

编辑

有了更多标签,y 轴上的数字分隔符默认不再代表每个唯一标签(在 OP 中更新的数据集中可见)。您可以通过在 scale_y_continuous 中设置 breaks 来解决此问题。

require(ggplot2)

ggplot(dat2, aes(x = JDeploy, xend = JRecover, y = as.numeric(Tag_Num), yend = as.numeric(Tag_Num))) +
geom_segment(size = 5) +
scale_y_continuous(breaks = unique(as.numeric(dat2$Tag_Num)), labels = paste("Tag", levels(dat2$Tag_Num))) +
ylab(NULL) +
xlab(NULL) +
scale_x_continuous(breaks = xbreaks2, labels = format(ISOdate(2004,1:12,1),"%b"))

关于r - 使用 ggplot 绘制时间标签覆盖率,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25189324/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com