gpt4 book ai didi

c# - 智能字符串比较

转载 作者:可可西里 更新时间:2023-11-01 03:13:24 28 4
gpt4 key购买 nike

我正在寻找一个允许对两个字符串进行智能比较的库/类。充其量它会给出两个字符串相似程度的百分比。我正在比较记录在不同存储库中的公司名称、地址,因此名称中有很多拼写错误或不一致。

要比较的示例字符串:

 "Good Company Ltd." vs. "GoodCompany" 
"Baker Street 2" vs. "Baker Str. 2"

如果我得到相似百分比的结果,那么这可以作为此类数据智能合并的输入。

你知道有什么好的库可以进行这种智能字符串比较吗?

最佳答案

Levenshtein 在这种情况下不合适。 “Good Company Ltd”和“GoodCompany”如果经过修剪,距离 = 3,而“Good Company Ltd”和“Food Company Ltd”的距离为 1,但含义完全不同。我建议 Metaphone or Double Metaphone算法。

使用 online metaphone comparer结果是:

Good Company Ltd = KTKMPNLTT
GoodCompany = KTKMPN
Food Company Ltd = FTKMPNLTT
GoodCompanyLLC = KTKMPNLK

这样你就知道GoodCompanyGood Company LtdGoodCompanyLLC是相似的,而Food Company拼写错误或完全不相关(KTKMPN 包含在 KTKMPNLTTKTKMPNLK 中,但不包含在 FTKMPNLTT 中)。

here用于其他算法比较。

关于c# - 智能字符串比较,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16713292/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com