gpt4 book ai didi

python - Python 中的 bool 搜索文本文件

转载 作者:行者123 更新时间:2023-11-28 16:27:46 26 4
gpt4 key购买 nike

我有一个包含 32 篇文章的文本文件。每篇文章都以表达式开头:<Number> of 32 DOCUMENTS ,例如:1 of 32 DOCUMENTS , 2 of 32 DOCUMENTS等。为了找到每篇文章,我使用了以下代码:

import re 
sections = []
current = []
with open("Aberdeen2005.txt") as f:
for line in f:
if re.search(r"(?i)\d+ of \d+ DOCUMENTS", line):
sections.append("".join(current))
current = [line]
else:
current.append(line)

print(len(sections))

现在,文章由表达式 sections 表示

接下来我要做的是将文章分成 2 组。那些包含以下词语的文章:economy OR economic AND uncertainty OR uncertainty AND tax OR policy,用数字 1 标识它们。

鉴于那些包含以下词语的文章:economy OR economic AND uncertain OR uncertainty AND regulation OR spending,用数字 2 标识它们。这是我到目前为止尝试过的:

for i in range(len(sections)):
group1 = re.search(r"+[economic|economy].+[uncertainty|uncertain].+[tax|policy]", , sections[i])
group2 = re.search(r"+[economic|economy].+[uncertainty|uncertain].+[regulation|spending]", , sections[i])

然而,它似乎不起作用。有什么想法吗?

最佳答案

有点罗嗦,但你可以不用这里的正则表达式,例如:

# Take a lowercase copy for comparisons
s = sections[i].lower()
if (('economic' in s or 'economy' in s) and
('uncertainty' in s or 'uncertain' in s) and
('tax' in s or 'policy' in s)):
do_stuff()

关于python - Python 中的 bool 搜索文本文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35012507/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com