gpt4 book ai didi

php - 文本和关键字列表之间的亲和性?

转载 作者:行者123 更新时间:2023-11-29 05:43:25 26 4
gpt4 key购买 nike

我有一部分文本(500-1500 个字符)

我有一个关键字列表(1000 条记录)..

我应该怎么做才能从该列表中找到与给定文本相关的关键字?

我想为列表中的每个关键字搜索这些关键字在我的文本中的出现次数,但我认为这有点“昂贵”

谢谢

最佳答案

如果关键字始终保持不变,您可以为它们创建索引,从而(极大地)提高搜索速度。处理此问题的标准数据结构是 trie但更好(!)的选择是 Aho-Corasick automaton或另一种多模式搜索算法,例如多模式 Horspool(也称为 Wu-Manber 算法)。

最后,一个非常简单的替代方法是将所有关键字与竖线 (|) 连接起来,并将结果用作正则表达式。从技术上讲,这接近 Aho-Corasick 自动机,并且实现起来要简单得多。

关于php - 文本和关键字列表之间的亲和性?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4680544/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com