gpt4 book ai didi

algorithm - 查找文本重复项 - 易于实现

转载 作者:塔克拉玛干 更新时间:2023-11-03 05:25:45 27 4
gpt4 key购买 nike

我正在寻找一些易于实现的算法来查找我的 cms 中的重复文本。实际上,我将文本保存到额外的列中,删除了空格并将所有字符设为小写,这样我可以找到重复项,如果它们在空格和字母大小写方面有所不同,但这还不够。

我如何处理两个文本有几个字符不同并且我还希望它们被识别为重复的情况?

最佳答案

解决此问题的简单方法是使用 Soundex 检查。您将每个词转换为它的 Soundex 等效词,消除小词,如果记录相同,则匹配。粗糙,但有效。

关于algorithm - 查找文本重复项 - 易于实现,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14817324/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com