gpt4 book ai didi

algorithm - 域名匹配算法

转载 作者:塔克拉玛干 更新时间:2023-11-03 06:31:08 26 4
gpt4 key购买 nike

我有一个公司列表,想匹配使用谷歌搜索获取的域,以确定哪些域可能属于同一家公司。是否有任何现有算法可用于此用例(法律也允许在商业项目中使用)。

例如我有 Internet Movie Database 作为公司名称,并说谷歌返回结果,其中有效的可能是 internetmoviedatabase、internet-movie-database、the-internet-movie-database、theinternetmoviedatabase、internetmovies、internet-movies、imd、imdb .(注意:我已将 TLD 从列表中排除以使问题更简单)

最佳答案

听起来您正在寻找一种近似的字符串匹配算法。不确定您是在寻找算法还是在寻找实现。

这里已经有一个问题: String matching algorithm

一种可能的解决方案是使用 Levenshtein 距离:http://en.wikipedia.org/wiki/Levenshtein_distance

如果你正在寻找一个实现,如果你谷歌“近似字符串匹配 C++”,这是第一个结果: http://www.chokkan.org/software/simstring/

祝你好运!

关于algorithm - 域名匹配算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15828121/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com