gpt4 book ai didi

r - R中 "Firstname Lastname"/"Lastname Firstname"的顺序无关模糊匹配?

转载 作者:行者123 更新时间:2023-12-04 12:12:15 24 4
gpt4 key购买 nike

我有两个单独收集的同一组学生的姓名列表。有许多打印错误,我一直在使用模糊匹配来链接这两个列表。我 99+% 有 agrep和类似的,但我坚持以下基本问题:我如何匹配(例如)名字“Adrian Bruce”和“Bruce Adrian”? Levenshtein 编辑距离不适用于这种特殊情况,因为它计算替换次数。

这一定是一个非常普遍的问题,但我找不到任何标准的 R 包或例程来解决它。我想我错过了一些明显的东西......???

最佳答案

嗯,一种相当简单的方法是交换单词并再次匹配......

y=c("Bruce Almighty", "Lee, Bruce", "Leroy Brown")
y2 <- sub("(.*) (.*)", "\\2 \\1", y)

agrep("Bruce Lee", y) # No match
agrep("Bruce Lee", y2) # Match!

关于r - R中 "Firstname Lastname"/"Lastname Firstname"的顺序无关模糊匹配?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9118045/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com