gpt4 book ai didi

python - 使用正则表达式搜索重复结构

转载 作者:行者123 更新时间:2023-11-28 22:38:55 28 4
gpt4 key购买 nike

我有一个字符串的结构:

A_1: text
a lot more text

A_2: some text
a lot more other text

现在我想提取描述性标题 (A_1) 和以下文本。就像是[("A_1", "text\na lot more text"),("A_2", "some text\na lot more other text")]

我用的表达方式是

(A_\d+):([.\s]+)

但我只得到 [('A_1', ' '), ('A_2', ' ')]。

有人对我有想法吗?

提前致谢,马丁

最佳答案

您可以使用 lookahead将匹配限制为搜索到的开始指示符的另一次出现。

(?s)A_\d+:.*?(?=\s*A_\d+:|$)
  • (?s) dotall flag使点也匹配换行符
  • A_\d+:您的开始指示符
  • .*?尽可能少的匹配(惰性点)
  • (?=\s*A_\d+:|$) until start pattern with optional spaces ahead or $ end

See demo at regex101.com (Python 代码生成器)

关于python - 使用正则表达式搜索重复结构,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35289098/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com