gpt4 book ai didi

r - 如何匹配R中两列之间的字符串?

转载 作者:行者123 更新时间:2023-12-03 08:20:40 25 4
gpt4 key购买 nike

我想根据两个现有列之间的字符串匹配创建一个新列 (MATCH)。例如-

<表类=“s-表”><标题>st_addaa_add匹配 <正文>jai maa duurga 协会jai maa duurga 殖民地匹配埃尔夫路1号高速公路公路 2 elph匹配srinivan 殖民地 parel ist斯里尼文巴士站不匹配

如果第 1 列和第 2 列之间存在三个或更多单词匹配,则第 3 列(MATCH)应显示“MATCH”。但如果匹配的单词少于 3 个或根本不匹配(例如第 3 行),则结果应为“NO MATCH”

如何使用 R 来做到这一点?

最佳答案

您可以尝试stringdist。您可以为匹配设置字符串距离阈值。它还提供了多种计算距离的方法。感谢 Ronak 提供的数据集代码。

library(stringdist)

df$match <- ifelse(stringdist(df$st_add, df$aa_add) < 12, "MATCH", "NOT MATCH")
df

# st_add aa_add match
# 1 jai maa durga society jai maa durga colony MATCH
# 2 elph road highway 1 road highway 2 elph MATCH
# 3 srinivan colony parel ist srinivan bus depot NOT MATCH

关于r - 如何匹配R中两列之间的字符串?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67956243/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com