gpt4 book ai didi

python - 正则表达式匹配第一个大写字母的单词

转载 作者:行者123 更新时间:2023-11-28 21:49:34 31 4
gpt4 key购买 nike

尝试使用正则表达式识别我的文本数据的结构并遇到障碍。

对于下面的示例文本

I AM A HEADER:
Lorem Ipsum is simply dummy text of the printingand typesetting industry. Lorem Ipsum has been the industry'sstandard dummy text ever since the 1500s.

I AM A TAB- Lorem Ipsum is simply dummy text of the printing

我下面的正则表达式选择“I AM A HEADER:”和“I AM A TAB-”

^\s*(?:\b[A-Z]+\b[\s]*)+(?:[:-])\s*$

请建议修改以匹配“I Am A Header”和“I Am A Tab”以及忽略结束标记“:”和“-”。

最佳答案

你可以使用

^\s*(?:\b[a-zA-Z]+\b\s*)+(?=[:-])

参见 regex demo

正则表达式分解:

  • ^ - 字符串的开始
  • \s* - 0 个或更多空格
  • (?:\b[a-zA-Z]+\b\s*)+ - 1个或多个序列
    • \b - 单词边界(冗余)
    • [a-zA-Z]+ - 1 个或多个字母
    • \b\s* - 0 个或更多空格。
  • (?=[:-]) - 前瞻要求 :- 紧跟在前面的子模式之后

这里的要点是将[a-z]添加到[A-Z]范围,删除\s*$并转 (?:...) 非捕获组到前瞻(不消耗字符)。

关于python - 正则表达式匹配第一个大写字母的单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33290283/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com