gpt4 book ai didi

r - dplyr 错误 - 当第一组全部为 NA 时,分组的 ntile 失败

转载 作者:行者123 更新时间:2023-12-01 15:07:36 24 4
gpt4 key购买 nike

我注意到,当我按组应用 dplyr (v0.4.3) ntile 函数时,第一组中的所有值均为 NA,第三组中所有值的结果也变为 NA。这是一个奇怪的错误(?),只有当第一组是 NA 时才会发生。

下面的简单示例 - 预期的行为是 ntile 会将组“a”中的所有 NA 值列为 NA,但它也会将组“c”列为 NA,即使它不包含 NA 值。如果我将 NA 值移动到组“b”,该函数将按预期工作。

x <- data.frame(group = rep(c("a","b","c","d"), 5), value = 1:20)
x$value <- ifelse(x$group == "a", NA, x$value)
x %>%
group_by(group) %>%
mutate(quintile = ntile(value, 5))

# Source: local data frame [20 x 3]
# Groups: group [4]
#
# group value quintile
# (fctr) (int) (int)
# 1 a NA NA
# 2 b 2 1
# 3 c 3 NA
# 4 d 4 1
# 5 a NA NA
# 6 b 6 2
# 7 c 7 NA
# 8 d 8 2
# 9 a NA NA
# 10 b 10 3
# 11 c 11 NA
# 12 d 12 3
# 13 a NA NA
# 14 b 14 4
# 15 c 15 NA
# 16 d 16 4
# 17 a NA NA
# 18 b 18 5
# 19 c 19 NA
# 20 d 20 5

作为背景,我是滞后的股票数据,它在第一个日期为所有值创建 NA。然后,当我按日期进行五分位数分组时,排名功能无法正常工作。

非常感谢,亚历克斯赖尔

最佳答案

这在开发版本中已修复per hadley's comment on the issue OP filed

关于r - dplyr 错误 - 当第一组全部为 NA 时,分组的 ntile 失败,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36563552/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com