gpt4 book ai didi

python - 什么文件格式可以让我在文件中非常快速地搜索字符串?

转载 作者:太空宇宙 更新时间:2023-11-04 05:19:41 24 4
gpt4 key购买 nike

我有一个 100GB 的随机文本字符串文件,长度在 4 到 200 个字符之间,每行一个。

我希望能够在文件中的任何字符串中找到一个字符串,例如如果可能的话,“footestbar”中任何“test”的出现。

否则我会很高兴能够找到以子字符串开头的行/记录,例如“foo”找到“footestbar”但找不到“testbarfoo”。

我正在考虑对文件进行一次排序,然后记录“a”行开始的位置,“b”行开始的位置等。这样可以让我快速跳转到正确的部分并减少花费的时间.我可以通过记录所有三个字符组合开始的位置来进一步提高速度,但有些东西告诉我有更好的方法。

最佳答案

我认为一个好的开始可能是生成一个 DAFSA .您可能必须将其与图形文件格式结合使用。

关于python - 什么文件格式可以让我在文件中非常快速地搜索字符串?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40754114/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com