gpt4 book ai didi

r - dplyr-如何在列排序顺序更改时插入 NA 值

转载 作者:行者123 更新时间:2023-12-02 01:34:03 29 4
gpt4 key购买 nike

当列值从 increasing 顺序更改为混合顺序时,我正在尝试找出一种插入 NA 值的简单方法。但是,如果在这个混合排序的行之后逻辑上继续增加顺序,那么也可以保留这些行。

如果所有行都没有递增顺序,请将这些行值替换为 NA。 (表示所有行混合排序)

此外,任何能保持其行内至少 5 个数字的排序顺序的列都可以通过(可以保持其行具有有序部分的行)。否则,替换 NA 值那些不能通过此逻辑的行。

我最好用 dplyr 来完成这个过程。我试着这样做,但想不出这个主意:(。

dt_new <- dt%>%
mutate_each(funs(replace(., which(ifelse(.....

示例数据

set.seed(123) 
C1 = c(1:10,7,8,11,12)
C2 = c(2:12,7,13,12)
C3 = sample(1:14)
C4 = c(1:14)
C5 = c(sample(1:9),5,6,7,8,10)

dt <- data.frame(C1,C2,C3,C4,C5)

C1 C2 C3 C4 C5
# 1 1 2 5 1 1
# 2 2 3 11 2 8
# 3 3 4 14 3 2
# 4 4 5 10 4 9
# 5 5 6 13 5 7
# 6 6 7 1 6 4
# 7 7 8 12 7 3
# 8 8 9 7 8 5
# 9 9 10 4 9 6
# 10 10 11 3 10 5
# 11 7 12 6 11 6
# 12 8 7 2 12 7
# 13 11 13 2 13 8
# 14 12 12 9 14 10

我寻找的输出

       C1 C2 C3 C4 C5
# 1 1 2 NA 1 1
# 2 2 3 NA 2 NA
# 3 3 4 NA 3 2
# 4 4 5 NA 4 NA
# 5 5 6 NA 5 NA
# 6 6 7 NA 6 NA
# 7 7 8 NA 7 3
# 8 8 9 NA 8 NA
# 9 9 10 NA 9 NA
# 10 10 11 NA 10 5
# 11 NA 12 NA 11 6
# 12 NA NA NA 12 7
# 13 11 13 NA 13 8
# 14 12 NA NA 14 9

最佳答案

这是一个非常牵强的解决方案......它适用于先前的输出,但不适用于当前的 C5:它将在第一次匹配到一系列 5 个连续增加的值之前删除任何值。

  1. 找出变量中是否有一系列 5 个递增的值。将值与 lag 进行比较。使用 rle 查找一系列 5。
  2. 如果没有 serie,返回 length=length(var)
  3. 的向量 NA
  4. 其他
    1. 将每个值与前一个值进行比较,如果劣质则移除
    2. 如果先前的值已被删除,则进行另一遍以与最后一个未删除的值进行比较。劣质者去除。在删除值时重复。

代码:

library(dplyr)
library(zoo)

co <- function(var){
r <- rle(lag(var) < var)
d <- data.frame(v=r$values,
l=r$lengths,
c=cumsum(r$lengths))
idx <- which(d$l > 3 & d$v==TRUE)[1] - 1
id <- d$c[idx]


v <- rep(NA,length(var))
if(!is.na(id)) {
p <- id:length(v)
v[p] <- ifelse(var[p] > lag(var[p]),
var[p],
NA)
v[id] <- var[id]

previous.na <- sum(is.na(lag(v[p])))

if(previous.na > 1) {
current.na <- 0

while(current.na != previous.na)
{
previous.na <- sum(is.na(v))
v[p][is.na(lag(v[p]))][-1] <- ifelse(v[p][is.na(lag(v[p]))][-1] > lag(na.locf(v[p]))[is.na(lag(v[p]))][-1],
v[p][is.na(lag(v[p]))][-1],
NA)
v[id] <- var[id]
current.na <- sum(is.na(v))
}

}
}

print(var)
return(v)
}
mutate_each(dt,funs = funs(co))

输出

   C1 C2 C3 C4 C5
1 1 2 NA 1 NA
2 2 3 NA 2 NA
3 3 4 NA 3 NA
4 4 5 NA 4 NA
5 5 6 NA 5 NA
6 6 7 NA 6 NA
7 7 8 NA 7 NA
8 8 9 NA 8 NA
9 9 10 NA 9 NA
10 10 11 NA 10 5
11 NA 12 NA 11 6
12 NA NA NA 12 7
13 11 13 NA 13 8
14 12 NA NA 14 10

我使用了这个数据集(C5 的 repeat set.seed)

C1 = c(1:10,7,8,11,12)
C2 = c(2:12,7,13,12)
set.seed(123)
C3 = sample(1:14)
C4 = c(1:14)
set.seed(456)
C5 = c(sample(1:9),5,6,7,8,10)
dt <- data.frame(C1,C2,C3,C4,C5)

关于r - dplyr-如何在列排序顺序更改时插入 NA 值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32242801/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com