gpt4 book ai didi

python - 如何在文本文件中多次出现某些单词后提取 3000 个字符?

转载 作者:太空宇宙 更新时间:2023-11-03 11:40:50 25 4
gpt4 key购买 nike

我有一个文本文件:

"Accounting Principles. Negative Pledge Clauses . Clauses Restricting Subsidiary Distributions . Lines of Business......Accounting Principles: is defined in the definition of IFRS. Administrative Agent: SVB......In the event that any Accounting Principles (as defined below) shall occur and such change results......"

在这个文件中,“会计准则”出现了3次,“IFRS”出现了1次。

我尝试在每个“会计原则”和“IFRS”之后提取 3000 个字符(或 300 个单词)。现在我只能把“Accounting Principles”第一次出现后的字符提取出来,分别为“Accounting Principles”和“IFRS”写代码。所以我的问题是如何在每次出现“会计准则”后提取 3000 个字符,以及如何编写一个代码来同时处理“会计准则”和“IFRS”,而不是使用两个单独的代码?

非常感谢!

我的代码如下:

import os
sourcepath=os.listdir('try/')
for filename in sourcepath:
inputfile='try/'+filename
with open(inputfile, 'r') as f:
text=f.read()
index=text.index('Accounting Principles')
right=text[index: index+3000]
print(right)

import os
sourcepath=os.listdir('try/')
for filename in sourcepath:
inputfile='try/'+filename
with open(inputfile, 'r') as f:
text=f.read()
index=text.index('IFRS')
right=text[index: index+3000]
print(right)

最佳答案

该程序查找“会计准则”或“IFRS”的每个实例,并打印匹配的字符串及其末尾后的 30 个字符。

import re

with open('x.in') as fp:
text = fp.read()

for m in re.finditer("Accounting Principles|IFRS", text):
print(text[m.start():m.end()+30])

关于python - 如何在文本文件中多次出现某些单词后提取 3000 个字符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49707915/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com