gpt4 book ai didi

python - 如何有效地搜索文件中的字符串?

转载 作者:塔克拉玛干 更新时间:2023-11-03 05:28:49 24 4
gpt4 key购买 nike

我有以下形式的 10GB 数据:

A=good
B=c++

现在我想找出 B 的 .例如,我希望找出“c++”,因为在这种情况下...我针对此问题采用的方法是选择 B 部分(即首先是第二行),然后从那里找出一个相等的字符串到 B 的字符串。然后在第二轮循环中......我正在寻找 B 的另一个值(现在是第 4 行)并从那里找到一个具有相同字符串的 B......等等

但是,上述方法需要花费大量时间,Python中是否有其他方法可以有效地解决这个问题。

最佳答案

由于您的文件太大而无法轻松放入内存,如何:

  1. 分成两个文件,As 和 Bs
  2. 对每个进行排序(例如使用 unix sort 或 Python 外部内存归并排序)
  3. 执行合并排序的合并步骤以查找重复项

关于python - 如何有效地搜索文件中的字符串?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11054496/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com