gpt4 book ai didi

php - 查找相似文本的最佳算法

转载 作者:塔克拉玛干 更新时间:2023-11-03 06:27:08 27 4
gpt4 key购买 nike

我正在尝试统一数据库中的记录,我正在使用 levenshtein 算法并适用于某些情况,

工作样本(距离 <= 2):

* --------- * ---------- * -------- *
| Looking | Finds | Distance |
* --------- * ---------- * -------- *
| No existe | No Existe | 1 |
| desempleo | Desempleo | 1 |
* --------- * ---------- * -------- *

那很好,但忽略了市长距离的情况,例如:

  • FemeninoFEMENINO 有 7 个距离

注意:我正在寻找一个 PHP 解决方案

最佳答案

比较

   echo levenshtein("Femenino", "FEMENINO");    // 7

对比

 echo levenshtein(strtolower("Femenino"), strtolower("FEMENINO"));  //0

如果字母表的大小写对您的应用程序无关紧要,请在比较之前让两个字符串的大小写相同,这样您会得到显着的改进。

关于php - 查找相似文本的最佳算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23394472/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com