gpt4 book ai didi

algorithm - 我怎样才能对相似词进行搜索匹配

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:25:33 24 4
gpt4 key购买 nike

我正在尝试自动对短文章进行分类,并且我正在尝试找出如何匹配相似的词 - 例如,shelf shelfs 或 painting and repaint

我使用的是 Porter 词干提取算法,但它仅在某些情况下有帮助,并且仅在词尾有帮助(上面的两个示例都不适用于它)。

是否有算法或相关单词列表可以帮助解决此类问题(除了自己制作之外?)

(我在 php 工作,所以使用该语言的任何解决方案都会更有帮助。)

最佳答案

Levenshtein Distance正是您要找的。

对于任意两个字符串,它计算将一个字符串更改为另一个字符串所需发生的最少插入、修改和删除次数。

如果距离很低,那么这两个词是相似的。

您还可以使用 Soundex确定两个词听起来是否相似的算法。

另见:
PHP levenshtein function
PHP soundex function

关于algorithm - 我怎样才能对相似词进行搜索匹配,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4064042/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com