gpt4 book ai didi

algorithm - 在庞大的列表中寻找热门关键词

转载 作者:塔克拉玛干 更新时间:2023-11-03 05:33:05 25 4
gpt4 key购买 nike

我有一个巨大的列表,大约有 100 000 行,如下所示:

  • 苹果新闻
  • 倒数
  • cddeeffipad
  • hell 世界
  • iworldthis..等等

并希望找到流行的子字符串,在这种情况下,“ipad”将是最受欢迎的,“world”将排在第二位。最小长度应为三个或四个字符。

我无法预测子字符串,所以使用字典是不行的。

最佳答案

这是一个相对复杂的问题……但使用前缀/后缀树可以解决。它本质上是 longest common subsequence 的变体。和 longest common substring问题。 - 这是我要开始的地方。

实际上有相当多的a bit of research关于此表单上的问题 - 您应该能够使用上述条款来缩小搜索范围。

关于algorithm - 在庞大的列表中寻找热门关键词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4168574/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com