r - 用高/低和日期填充两行之间的区域-6ren

r - 用高/低和日期填充两行之间的区域

转载作者：行者123 更新时间：2023-12-04 08:23:24

24

4

前言:对于我自己的问题，我提供了一个合理令人满意的答案。我了解这是可以接受的做法。我自然希望能提出建议和改进。

我的目的是绘制两个时间序列(存储在数据框中，日期存储为“Date”类)，并根据一种颜色是否位于另一种颜色之上，用两种不同的颜色填充数据点之间的区域。例如，绘制债券指数和股票指数，当股票指数高于债券指数时以红色填充区域，否则以蓝色填充区域。

我已经使用ggplot2来实现此目的，因为我相当熟悉该软件包(作者:Hadley Wickham)，但是可以随时提出其他建议。我基于geom_ribbon()包的ggplot2函数编写了一个自定义函数。早期，我遇到了与缺乏处理geom_ribbon()函数和'Date'类的对象的经验有关的问题。下面的函数表示我为解决这些问题所做的努力，几乎可以肯定它是环形交叉路口，不必要的复杂，笨拙等。所以我的问题是:请提出改进和/或替代方法。最终，在这里提供通用功能将是很棒的。

数据:

set.seed(123456789)
df <- data.frame(
    Date  = seq.Date(as.Date("1950-01-01"), by = "1 month", length.out = 12*10),
    Stocks = 100 + c(0, cumsum(runif(12*10-1, -30, 30))),
    Bonds = 100 + c(0, cumsum(runif(12*10-1, -5, 5))))
library('reshape2')
df <- melt(df, id.vars = 'Date')

自定义功能:

## Function to plot geom_ribbon for class Date
geom_ribbon_date <- function(data, group, N = 1000) {
    # convert column of class Date to numeric
    x_Date <- as.numeric(data[, which(sapply(data, class) == "Date")])
    # append numeric date to dataframe
    data$Date.numeric <- x_Date
    # ensure fill grid is as fine as data grid
    N <- max(N, length(x_Date))
    # generate a grid for fill
    seq_x_Date <- seq(min(x_Date), max(x_Date), length.out = N)
    # ensure the grouping variable is a factor
    group <- factor(group)
    # create a dataframe of min and max
    area <- Map(function(z) {
        d <- data[group == z,];
        approxfun(d$Date.numeric, d$value)(seq_x_Date);
    }, levels(group))
    # create a categorical variable for the max
    maxcat <- apply(do.call('cbind', area), 1, which.max)
    # output a dataframe with x, ymin, ymax, is. max 'dummy', and group
    df <- data.frame(x = seq_x_Date, 
        ymin = do.call('pmin', area), 
        ymax = do.call('pmax', area), 
        is.max = levels(group)[maxcat],
        group = cumsum(c(1, diff(maxcat) != 0))
    )
    # convert back numeric dates to column of class Date
    df$x <- as.Date(df$x, origin = "1970-01-01")
    # create and return the geom_ribbon
    gr <- geom_ribbon(data = df, aes(x, ymin = ymin, ymax = ymax, fill = is.max, group = group), inherit.aes = FALSE)
    return(gr)
}

用法:

ggplot(data = df, aes(x = Date, y = value, group = variable, colour = variable)) + 
    geom_ribbon_date(data = df, group = df$variable) +
    theme_bw() +
    xlab(NULL) +
    ylab(NULL) +
    ggtitle("Bonds Versus Stocks (Fake Data!)") +
    scale_fill_manual('is.max', breaks = c('Stocks', 'Bonds'), 
                        values = c('darkblue','darkred')) +
    theme(legend.position = 'right', legend.direction = 'vertical') +
    theme(legend.title = element_blank()) +
    theme(legend.key = element_blank())

结果:

尽管有关于stackoverflow的相关问题和解答，但我还没有找到足够详细的问题来解决我的问题。以下是一些有用的交流:

create-geom-ribbon-for-min-max-range:提出类似的问题，但提供的细节少于我想要的。

possible-bug-in-geom-ribbon:密切相关，但是缺少有关如何计算最大/最小的中间步骤。

fill-region-between-two-loess-smoothed-lines-in-r-with-ggplot:密切相关，但侧重于黄土线。优秀的。

ggplot-colouring-areas-between-density-lines-according-to-relative-position:密切相关，但重点在于密度。这篇文章极大地启发了我。

最佳答案

也许我没有理解您的全部问题，但似乎一个相当直接的方法是将第三行定义为每个时间点两个时间序列中的最小值。然后，调用geom_ribbon两次(对于Asset的每个唯一值一次)，以绘制由每个系列和最小线条形成的色带。代码如下所示:

set.seed(123456789)
df <- data.frame(
  Date  = seq.Date(as.Date("1950-01-01"), by = "1 month", length.out = 12*10),
  Stocks = 100 + c(0, cumsum(runif(12*10-1, -30, 30))),
  Bonds = 100 + c(0, cumsum(runif(12*10-1, -5, 5))))

library(reshape2)
library(ggplot2)
df <- cbind(df,min_line=pmin(df[,2],df[,3]) ) 
df <- melt(df, id.vars=c("Date","min_line"), variable.name="Assets", value.name="Prices")

sp <- ggplot(data=df, aes(x=Date, fill=Assets))
sp <- sp + geom_ribbon(aes(ymax=Prices, ymin=min_line))
sp <- sp + scale_fill_manual(values=c(Stocks="darkred", Bonds="darkblue"))
sp <- sp + ggtitle("Bonds Versus Stocks (Fake Data!)")
plot(sp)

这将产生以下图表:

关于r - 用高/低和日期填充两行之间的区域，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/33318391/

24

4

0

文章推荐： inversion-of-control - Ninject 和 Log4Net

文章推荐： domain-driven-design - 我可以重用值对象吗？

linux - 低 CPU、低 RAM、低 IO，但性能很差，为什么？
我的 Linux Centos Apache 服务器的性能有问题。我有一个程序(用 c 语言编写)可以同时执行许多 http 请求。这个过程本身看起来非常有效，就好像我可以同时向外部服务器发出 500
Python 设置并行端口数据引脚高/低
我想知道如何将并行端口上的数据引脚设置为高电平和低电平。我相信我可以使用 PyParallel 来实现此目的，但我不确定如何设置特定的引脚。谢谢! 最佳答案您在这里谈论的是软件-硬件接口(inte
python - 盘中数据的每日高/低
让我有一个像这样的日期时间索引的数据框: date_time open high low close vol 2018-05-13 18:00:00 70.
emacs - 低 Octave 卡住
在 emacs Octave 模式下，当我输入 M-x run-octave 时，命令会卡住，所以我使用 C-g 进行转义。我可以用 C-x b 切换到 *Inferior Octave* 缓冲区，但
python - 精度比 gridsearchCV 低
我正在 sklearn 中运行 gridsearchCV，尝试使用此代码找到最佳模型参数。 modelDNN= KerasRegressor(build_fn=build_DNN_model, epo
android - 低 android 存储会影响应用程序的性能吗？
美好的一天。我想知道 android 存储是否低，它会影响应用程序性能吗？因为同一个应用程序在另一台设备上运行速度很快，而同样的应用程序在另一台设备上非常滞后，后者有 12GB 内存中的 2GB 可用
mysql - 低 mysql 索引基数但数据多样
所以我在列卡上有一个带有索引的表当我运行时 SELECT COUNT(DISTINCT(card)) FROM table 它返回 490 个不同的条目但是当我运行的时候 SHOW INDEXES
python - 当最后一位为零 [低] 时将二进制转换为整数时出错
我正在使用手动方法将二进制转换为十进制。此代码在最后一位为高的情况下工作正常，例如:1001。当最后一位为零 [低] 时会出现错误。例如:1010 应该给出 10 但给出 5，因为没有考虑最后一位。有
sql - 低 MySQL 表缓存命中率
我一直在努力优化我的站点和数据库，并且我一直在使用 mysqltuner.pl 来帮助解决这个问题。除了表缓存命中率，无论我在 my.cnf 中将它提高多高，我几乎都得到了正确的结果，我仍然命中大约
iOS 模拟器游戏运行速度非常慢(低 fps)
深入研究 sprite kit (xcode 5)。我正在使用两个示例程序，1. 创建新项目时包含的默认宇宙飞船示例和 2. 我下载的 Adventure Game。在 iOS 模拟器中运行这些示例
C# 故意循环。 (低 CPU 使用率)
编辑: 感谢大家在这里提供答案，项目已完成。 https://github.com/0xyg3n/ProcessDaemon/ 如果有人想出可能会更好的多线程解决方案，我想。我是 C# 的新手，我想
delphi - 交换字变量的字节(低/高)的过程
我有一个交换 Word 变量的字节(低/高)的过程(它与 System.Swap 函数执行相同的操作)。该过程在编译器优化关闭时有效，但在编译器优化打开时无效。有人可以帮我解决这个问题吗？ proce
programming-languages - 低，中，高级语言有什么区别？
我以前听说过这些术语描述语言，例如 C 并不是一种低级语言，C++是中级语言，而Python是一种高级语言。我知道它必须与代码的编译方式以及代码的编写方式有关。但是我想知道的是，什么将语言定义为这三类
performance - NoSQL 数据库的开销和(低)效率？
我有一个关于 NoSQL 类型数据库的问题，特别是 MongoDB，但它通常适用于大多数键值或基于文档的存储。 NoSQL 的一些卖点是速度和可扩展性，但在我看来，与关系数据库相比，开销很大。你有很
java - LibGDX 上的 fps 低
如果没有此代码，fps 为 60-65。但是当我使用这段代码时，fps 下降到 50。另一个问题是某些设备上的 FPS 太低。然而，游戏非常简单。我对所有形状使用 ShapeRenderer。游戏在
java - Java 中的 FPS 低
您好，我的名字是 Ryan，我目前正在开发自己的 2D java 游戏。目前游戏世界中有很多物体。游戏重新开始时，世界会加载 100 棵随机放置的树木，这些树木是使用数组列表和树类制作的。我的游戏使用
低 CPU 利用率的 Java 最佳编码实践
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它，visit the help center 。已关
postgresql - 低 Postgres 缓存命中率 - 数据大小或其他？
我刚刚将我的 Heroku postgres 数据库从 Kappa 计划(800MB RAM，postgres 9.1)升级到 Ronin 计划(1.7GB RAM，postgres 9.2)，但性能
ios nsdictionary 低平均高
现在我正在使用我的 NSDictionary 并运行所有值的循环以找到低值、高值和计算平均值。由于我是IOS 的新手，所以我想问问是否有更好的方法来做到这一点。有没有？谢谢。最佳答案这个问题的
c++ - arduino 低 i2c 读取速度；
我目前正在使用 genuino 101 进行一个项目，我需要通过 i2c 读取大量数据，以填充任意大小的缓冲区。从下图中我可以看到读取请求本身只需要大约 3毫秒，写请求大约 200 纳秒。但是在同一

首页

博学

6Ren·AI

商城

r - 用高/低和日期填充两行之间的区域