gpt4 book ai didi

python - 提取特定的文本行?

转载 作者:太空狗 更新时间:2023-10-30 00:42:02 30 4
gpt4 key购买 nike

我有一个几十万行的大文本文件。我必须随机抽取文本文件中的 30,000 行特定行。这是我必须一次提取一行的程序:

big_file = open('C:\\gbigfile.txt', 'r')
small_file3 = open('C:\\small_file3.txt', 'w')
for line in big_file:
if 'S0414' in line:
small_file3.write(line)
gbigfile.close()
small_file3.close()

我怎样才能加快我需要查找的 30,000 行的速度>?

最佳答案

啊哈!因此,您真正的问题是如何在每行中测试多个条件,如果满足其中一个条件,则输出该行。我认为最简单的方法是使用正则表达式:

import re
keywords = ['S0414', 'GT213', 'AT3423', 'PR342'] # etc - you probably get those from some source
pattern = re.compile('|'.join(keywords))

for line in inf:
if pattern.search(ln):
outf.write(line)

关于python - 提取特定的文本行?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3248395/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com