gpt4 book ai didi

带有映射表的 R 过滤表可减少 NA 值

转载 作者:行者123 更新时间:2023-12-02 01:22:05 25 4
gpt4 key购买 nike

我想过滤一个表bsp1

g <- factor(c("Company 1", "Company 2", "Company 3", "Company 4", "Company 5"))
w <- factor(c("a", "b", "c", "a", "c"))
x <- c(28, 18, 25, NA, 21)
y <- c(80, NA, 74, 101, NA)
z <- c(170, 174, 183, NA, 185)
bsp1 <- data.frame(g, w, x, y, z)
colnames(bsp1) <- c("Company", "Sector", "Item 1", "Item 2", "Item 3")
rm(w, x, y, z)
bsp1

# Company Sector Item 1 Item 2 Item 3
# 1 Company 1 a 28 80 170
# 2 Company 2 b 18 NA 174
# 3 Company 3 c 25 74 183
# 4 Company 4 a NA 101 NA
# 5 Company 5 c 21 NA 185

基于映射表bsp2

sector <- factor(c("a", "b", "c"))
a <- c(1, 1, 1)
b <- c(NA, 1, NA)
c <- c(NA, NA, 1)
bsp2 <- data.frame(sector, a, b, c)
colnames(bsp2) <- c("Sector", "Item 1", "Item 2", "Item 3")
bsp2

# Sector Item 1 Item 2 Item 3
# 1 a 1 NA NA
# 2 b 1 1 NA
# 3 c 1 NA 1

过滤规则应该是:对于 bsp2 中项目不是 NA 的每个扇区,应删除 bsp1 中项目中具有 NA 的相应扇区的行。

因此,期望的结果看起来像 bsp3

bsp3 <- bsp1[c(1, 3, 5),]
bsp3

# Company Sector Item 1 Item 2 Item 3
# 1 Company 1 a 28 80 170
# 3 Company 3 c 25 74 183
# 5 Company 5 c 21 NA 185

公司 2 已删除,因为 b 需要项目 2。第 5 行没有删除,因为第 3 部分不需要第 2 项。

我想到了一个适用于 bsp1 上所有扇区的函数,其中包含一个相关列的向量,该向量使用以下向量函数导出。

a <- !is.na(bsp2[1,])
a <- which(a==c("TRUE"))

不幸的是,在一个向量的过滤测试中,我遇到了一个问题,即 b 被解释为矩阵。

b <- is.na(bsp1[, a]) 
c <- which(b==c("TRUE"))
reduced2016b <- data2013[-c,]

即使我手动设置了矢量,过滤结果也不是我期望的那样。如果有人有解决这个问题的想法,那就太好了。部分步骤也会对我有所帮助。

提前致谢!

最佳答案

一种方法是melt两个数据框,按Sector和变量merge,找出哪些公司的值有NA .x 而不是 NA 用于 value.y,即

library(reshape2)
new_df <- merge(melt(bsp1), melt(bsp2), by = c('Sector', 'variable'))
ind <- as.character(new_df$Company[is.na(new_df$value.x) & !is.na(new_df$value.y)])
bsp1[!bsp1$Company %in% ind,]

# Company Sector Item 1 Item 2 Item 3
#1 Company 1 a 28 80 170
#3 Company 3 c 25 74 183
#5 Company 5 c 21 NA 185

关于带有映射表的 R 过滤表可减少 NA 值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39508065/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com