gpt4 book ai didi

r - 如何在 R 中找到具有值(每行)的最后一列?

转载 作者:行者123 更新时间:2023-12-02 16:20:59 24 4
gpt4 key购买 nike

假设有一个包含多个测量值的数据框,其中缺少一些测量值。如果缺少该值,则所有后续测量值也会丢失。如何找到最后的测量值?

df <- data.frame(id = c(1, 2, 3, 4), m_1 = c('a', 'b', 'c', 'd'), m_2 = c('e', NA, 'g', 'h'), m_3 = c('i', NA, NA, 'l'))

df
id m_1 m_2 m_3
[1] 1 a e i
[2] 2 b <NA> <NA>
[3] 3 c g <NA>
[4] 4 d h l

有两个选项我都想要。

df
id m_1 m_2 m_3 m
[1] 1 a e i m_3
[2] 2 b <NA> <NA> m_1
[3] 3 c g <NA> m_2
[4] 4 d h l m_3

df
id m_1 m_2 m_3 m
[1] 1 a e i i
[2] 2 b <NA> <NA> b
[3] 3 c g <NA> g
[4] 4 d h l l

我试图混合mutatewhich , colnamesis.na ,但没有成功。

最佳答案

一个选项是来自 base Rmax.col,用于获取存在非 NA 元素的每行的列索引。 ties.method 可以是“random”“first”“last”。由于我们想要 last 非 NA,请将 "last" 指定为 ties.method

df$m <- names(df)[-1][max.col(!is.na(df[-1]), 'last')]
df$m
#[1] "m_3" "m_1" "m_2" "m_3"

或者对于第二个选项,cbind 使用行索引并提取元素

df[-1][cbind(seq_len(nrow(df)), max.col(!is.na(df[-1]), 'last'))]
#[1] "i" "b" "g" "l"

或者可以使用tidyverse来完成

library(dplyr)
df %>%
rowwise %>%
mutate(m = {tmp <- c_across(starts_with('m'))
tail(na.omit(tmp), 1)}) %>%
ungroup

或者,如果我们想同时获得两者,那么可以选择将其 reshape 为“长”格式

library(tidyr)
df %>%
pivot_longer(cols = starts_with('m'), values_drop_na = TRUE,
names_to = "m_name", values_to = 'm_value') %>%
group_by(id) %>%
slice_tail(n = 1)%>%
ungroup %>%
right_join(df) %>%
select(names(df), everything())

-输出

# A tibble: 4 x 6
# id m_1 m_2 m_3 m_name m_value
# <dbl> <chr> <chr> <chr> <chr> <chr>
#1 1 a e i m_3 i
#2 2 b <NA> <NA> m_1 b
#3 3 c g <NA> m_2 g
#4 4 d h l m_3 l

关于r - 如何在 R 中找到具有值(每行)的最后一列?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65524144/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com