gpt4 book ai didi

r - 在查找表中使用多个引用值

转载 作者:行者123 更新时间:2023-12-04 10:55:07 25 4
gpt4 key购买 nike

在 R 中使用 data.table,我有两个数据表。一个是我的实际数据集,另一个是查找表。

数据集:

dt <- data.table(Name = c("John", "Bob", "Sue", "Trish"), Ref = c("a", "A0", "BA", "c"))

**Name** **Ref**
John a
Bob A0
Sue BA
Trish c

查找表:
lookup <- data.table(Ref1 = c("a", "b", "c"), Ref2 = c("A0", "AA", "BA"), Value = 1:3)

**Ref1** **Ref2** **Value**
a A0 1
b aa 2
c BA 3

如您所见,查找表中的每个值都有两个不同的引用。我想将 Ref2 值转换为 Ref1,然后进行查找或直接进行所有查找。

到目前为止,我的方法是拆分 dt,因此每个拆分都包含每种格式的样式,然后查找值,最后查找 rbind。
dt1 <- dt[dt[, nchar(Ref) == 2,],]
dt2 <- dt[dt[, nchar(Ref) == 1,],]

setnames(lookup, c("Ref1", "Ref", "Value"))
setkey(lookup, Ref)

dt1Merged <- merge(dt1, lookup, by = "Ref")[,c(1:2, 4), with = F]

setnames(lookup, c("Ref", "Ref2", "Value"))
setkey(lookup, Ref)

dt2Merged <- merge(dt2, lookup, by = "Ref")[,c(1:2, 4), with = F]

result <- rbind(dt1Merged, dt2Merged)

这种方法需要大量代码并且效率不高。有没有更有效的方法来做到这一点?由于这只是大量操作中的一小部分,如果答案使用 data.table 或快速转换为这种格式,则更好。

最佳答案

也许你可以先把你的查找表融化成一列中的所有引用和它们旁边的相应值,然后合并data.tables

newlookup=melt(lookup,id.vars="Value")
setnames(newlookup, c("Value", "oldRef", "Ref"))
merge(dt,newlookup,by="Ref")

关于r - 在查找表中使用多个引用值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28196216/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com