gpt4 book ai didi

r - 如何在 R 中连接 2 个具有最大匹配字符串的表?

转载 作者:行者123 更新时间:2023-12-02 18:14:20 26 4
gpt4 key购买 nike

我想用最大匹配字符串加入 2 个表 1 和表 2(左侧在 COlB 上,右侧在 Cold 上)

表一

<表类="s-表"><头>ColAColB<正文>123C/O room Hanbur court vaux road456House Malveri 商业园

表2

<表类="s-表"><头>寒冷ColC<正文>汉 bool 阁Lightroom马尔维里公园办公室

输出表

<表类="s-表"><头>ColAColB对齐<正文>123C/O room Hanbur court vaux roadLightroom456House Malveri 商业园办公室

最佳答案

使用fuzzyjoin,可以根据距离加入选项

library(fuzzyjoin)
library(dplyr)
stringdist_inner_join(df1, df2, by = c(ColB = "ColD"),
max_dist = 0.5, method = "jaccard") %>%
select(-ColD)
ColA ColB ColC
1 123 C/O room Hanbur court vaux road Lightroom
2 456 House Malveri business park Office

数据

df1 <- structure(list(ColA = c(123L, 456L),
ColB = c("C/O room Hanbur court vaux road",
"House Malveri business park")), class = "data.frame", row.names = c(NA,
-2L))

df2 <- structure(list(ColD = c("Hanbur Court", "Malveri park"),
ColC = c("Lightroom",
"Office")), class = "data.frame", row.names = c(NA, -2L))

关于r - 如何在 R 中连接 2 个具有最大匹配字符串的表?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/71831994/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com