gpt4 book ai didi

python - 如何编写脚本来迭代搜索文档并根据模式返回结果

转载 作者:行者123 更新时间:2023-12-01 07:06:16 27 4
gpt4 key购买 nike

我有一个大文档,其中包含以特定模式出现的项目:“我需要文字”“,”(逗号结束我要返回的文本)“我不需要更多文字”“。” “TEXT I NEED”(需要紧接句点后的文本)“,”(逗号结束文本)..等等。

我希望编写一个脚本来浏览文档并提取(我需要的文本)。

我还没有尝试太多。我尝试过使用 re.compile,但我主要是一个初学者。

文档示例:苹果很有趣,橙子更好。橙子很有趣,香蕉更好。香蕉很奇怪,香蕉有点奇怪。

我想返回:苹果很有趣橙子很有趣香蕉很奇怪

最佳答案

如果您只需要大写 ASCII 字母,则如下所示:

[A-Z]+
  • 方括号定义要匹配的内容的集合
  • 连字符定义一个范围,在本例中是从大写 A 到大写 Z
  • 加号表示该范围内至少有一个字符,但如果它们彼此相邻,则可能会更多

示例:

http://regexr.com/4n1s1

import re
pattern = re.compile('[A-Z]+')
matches = pattern.findall('APPLES ARE FUN, oranges are better. ORANGES ARE FUN, bananas are better')
print(matches)
# ['APPLES', 'ARE', 'FUN', 'ORANGES', 'ARE', 'FUN']

关于python - 如何编写脚本来迭代搜索文档并根据模式返回结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58434579/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com