gpt4 book ai didi

python - 一些关于 Python 正则表达式的帮助

转载 作者:太空宇宙 更新时间:2023-11-04 10:58:48 25 4
gpt4 key购买 nike

我对 Python 和正则表达式都很陌生,所以请多多包涵。我有一些看起来像这样的文本:

Change 421387 on 2011/09/20 by person@domain.com    Some random text    including line breaksChange 421388 on 2011/09/20 by person2@domain.com    Some other random text  including line breaks

现在,我想使用 python 和正则表达式将其拆分为一个元组。最后我希望元组包含两个元素。

元素 0:

Change 421387 on 2011/09/20 by person@domain.com    Some random text    including line breaks

元素 1:

Change 421388 on 2011/09/20 by person2@domain.com    Some other random text  including line breaks

我意识到我可以使用正则表达式来识别由以下内容形成的模式:

  • “改变”这个词
  • 空间
  • 一些数字
  • 一些文字
  • 日期格式为####/##/##
  • 一些文字
  • @
  • 一些文字
  • 换行符

我知道它可以进一步分解,但我认为认识到这些东西就足以满足我的目的。

一旦我想出了该模式的正则表达式,我该如何使用它将字符串拆分为字符串元组?

最佳答案

使用前瞻断言。

>>> re.split(r'(?=\s+Change \d+ on \d{4})\s+', '''    Change 421387 on 2011/09/20 by person@domain.com
... Some random text including line breaks
... Change 421388 on 2011/09/20 by person2@domain.com
... Some other random text including line breaks''')
['', 'Change 421387 on 2011/09/20 by person@domain.com\n Some random text including line breaks', 'Change 421388 on 2011/09/20 by person2@domain.com\n Some other random text including line breaks']

关于python - 一些关于 Python 正则表达式的帮助,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7492599/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com