gpt4 book ai didi

r - stringdist_join 结果为 NA

转载 作者:行者123 更新时间:2023-12-01 13:30:11 26 4
gpt4 key购买 nike

我正在尝试使用 stringdist 包来进行模糊连接,但我遇到了一个我不理解的问题,也没有找到答案。我想用“dl”方法连接这两个数据表,它产生一个 NA,我完全不明白。也许你们中的一个人对此有解释。代码:

library(fuzzyjoin)
test1<-as.data.frame(test1<-c("techniker"))
test2<-as.data.frame(test2<-c("technician"))
setnames(test2,1,"label")
setnames(test1,1,"label")
x <- stringdist_join(test1, test2, by = "label", mode = "left", distance_col="distance", method="dl")

但是,如果我使用 jaccard 方法,则存在匹配:

y <- stringdist_join(test1, test2, by = "label", mode = "left", distance_col="distance", method="jaccard", q=4) 

希望有大佬指点一下

干杯穹顶

最佳答案

max_dist 默认设置为 2。

"tekniker""technician" 之间的dl 距离大于 2。

所以没有匹配。

stringdist_join(test1, test2, by = "label", mode = "left", distance_col="distance", method="dl",max_dist=5)
# label.x label.y distance
# 1 techniker techni 3

关于r - stringdist_join 结果为 NA,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46346918/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com