gpt4 book ai didi

python - 用于提取关注者计数的正则表达式模式

转载 作者:行者123 更新时间:2023-12-01 02:34:31 31 4
gpt4 key购买 nike

我正在从字符串中提取关注者编号,如下所示。第一个模式似乎不适用于个位数。是否因为第一个模式检查数字后面是否有字符,并且第一行在 4Followers 之间没有其他字符?第二种模式效果很好。

import re

text = """
4 Followers
330 Followers
23.5k Followers
67k Followers
25m Followers
"""
print(re.compile(r'(\d.+) Followers').findall(text))
print(re.compile(r'(\d+|\d.+) Followers').findall(text))

最佳答案

\d.+ 模式匹配一​​个数字,然后匹配除换行符之外的 1 个或多个字符。

您似乎想要匹配一个数字,然后匹配除空格之外的任何内容,直到空格后跟 Followers

使用

text = """
4 Followers
330 Followers
23.5k Followers
67k Followers
25m Followers
"""
print(re.findall(r'\b(\d\S*) Followers', text))
# => ['4', '330', '23.5k', '67k', '25m']

请参阅regexPython demo .

详细信息

  • \b - 单词边界
  • (\d\S*) - 第 1 组:一个数字,然后是 0+ 个非空白符号
  • Followers - 文字子字符串。

如果您的输入格式正确,您还可以拆分字符串:

[x.split()[0] for x in text.split('\n')]

请参阅Python demo (输出:['4', '330', '23.5k', '67k', '25m'])。

关于python - 用于提取关注者计数的正则表达式模式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46415386/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com