gpt4 book ai didi

文本中多词匹配的算法

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:20:22 25 4
gpt4 key购买 nike

我有一大组单词(大约 10,000 个),我需要找出这些单词中是否有任何出现在给定的文本 block 中。

有没有比对文本 block 中的每个单词进行简单文本搜索更快的算法?

最佳答案

将 10,000 个单词输入哈希表,然后检查文本 block 中的每个单词,如果它的哈希表中有一个条目。

虽然我不知道是否更快,只是另一种方法(取决于您搜索的单词数量)。

简单的 perl 示例:

my $word_block = "the guy went afk after being popped by a brownrabbit";
my %hash = ();
my @words = split /\s/, $word_block;
while(<DATA>) { chomp; $hash{$_} = 1; }
foreach $word (@words)
{
print "found word: $word\n" if exists $hash{$word};
}

__DATA__
afk
lol
brownrabbit
popped
garbage
trash
sitdown

关于文本中多词匹配的算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1099985/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com