gpt4 book ai didi

python - 一般和 python 中执行字符串搜索的最快方法

转载 作者:塔克拉玛干 更新时间:2023-11-03 04:12:11 24 4
gpt4 key购买 nike

<分区>

我的任务是在非常短的文档列表中搜索字符串或模式(比如 200 个字符长)。但是,假设有 100 万份这样的文件。执行此搜索的最有效方法是什么?我正在考虑对每个文档进行标记,并将单词放入散列表中,以单词为键,文档编号为值,然后创建一个词袋。然后执行单词搜索并检索包含该单词的文档列表。据我所见,此操作将进行 O(n) 操作。还有别的办法吗?可能不使用哈希表?

另外,有没有python库或者第三方包可以进行高效的搜索?

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com