gpt4 book ai didi

r - 如何将适用于 data.frame 单元格的函数应用于 data.frame 列

转载 作者:行者123 更新时间:2023-12-01 23:49:49 24 4
gpt4 key购买 nike

这个问题是对我之前提出的一个不清楚的问题的改编。我正在逐行检查列 V1 和 V2 是否有公共(public)代码。代码由正斜杠“/”分隔。下面的函数应该从同一行的 V1 中取出一个单元格,从 V2 中取出一个单元格,并将它们转换为向量。矢量的每个元素都是一个代码。然后该函数应检查获得的两个向量是否具有共同元素。这些元素最初是 4 位代码。如果两个向量之间有任何匹配的 4 位代码,则函数应返回 4。如果没有共同元素,则函数应减少每个代码的位数,然后再次检查。每次该函数减少位数时,它也会减少最后返回的分数。我希望将函数返回的值写入我选择的列中。

这是我的起始条件

structure(list(ID = c(2630611040, 2696102020, 2696526020), V1 = c("7371/3728", 
"2834/2833/2836/5122/8731", "3533/3541/3545/5084"), V2 = c("7379",
"3841", "3533/3532/3531/1389/8711")), .Names = c("ID", "V1",
"V2"), class = "data.frame", row.names = c(NA, 3L))

ID V1 V2
1 2630611040 7371/3728 7379
2 2696102020 2834/2833/2836/5122/8731 3841
3 2696526020 3533/3541/3545/5084 3533/3532/3531/1389/8711

我想得到这个

          ID                       V1                       V2   V3
1 2630611040 7371/3728 7379 3
2 2696102020 2834/2833/2836/5122/8731 3841 0
3 2696526020 3533/3541/3545/5084 3533/3532/3531/1389/8711 4

我的功能是这样的

coderelat<-function(a, b){

a<-unique(as.integer(unlist(str_split(a, "/")))) #Transforming cells into vectors of codes
b<-unique(as.integer(unlist(str_split(b, "/"))))

a<-a[!is.na(a)]
b<-b[!is.na(b)]

if (length(a)==0 | length(b)==0) { # Check that both cells are not empty

ir=NA
return(ir)

} else {


for (i in 3:1){

diff<-intersect(a, b) # See how many products the shops have in common

if (length(diff)!=0) { #As you find a commonality, give ir the corresponding scoring

ir=i+1
break

} else if (i==1 & length(diff)==0) { #If in the last cycle, there is still no commonality put ir=0

ir=0
break

} else { # If there is no commonality and you are not in the last cycle, reduce the nr. of digits and re-check commonality again

a<- unique(as.integer(substr(as.character(a), 1, i)))
b<- unique(as.integer(substr(as.character(b), 1, i)))

}

}
}
return(ir)
}

当我手动提供单个电池时,该功能有效。但是当我这样写时它不起作用:

df$V4<-coderelat(df$V1, df$V2)

我真的很感谢任何帮助,因为我不知道如何让它工作。

非常感谢。里卡多

最佳答案

这是一个使用 data.tables 的解决方案。

get.match <-function(a,b) {
A <- unique(strsplit(a,"/",fixed=TRUE)[[1]])
B <- unique(strsplit(b,"/",fixed=TRUE)[[1]])
for (i in 4:1) if(length(intersect(substr(A,1,i),substr(B,1,i)))>0) return(i)
return(0L)
}
library(data.table)
setDT(df)[,V3:=get.match(V1,V2),by=ID]
df
# ID V1 V2 V3
# 1: 2630611040 7371/3728 7379 3
# 2: 2696102020 2834/2833/2836/5122/8731 3841 0
# 3: 2696526020 3533/3541/3545/5084 3533/3532/3531/1389/8711 4

关于r - 如何将适用于 data.frame 单元格的函数应用于 data.frame 列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27049001/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com