正则表达式捕获包含在其他字符中的列表中的数字

转载作者：行者123 更新时间：2023-12-01 09:13:58

28

4

嘿，

所以，我有以下字符串(我删除了很多数字，因为我们不需要它们):

编辑:见下文

text = """
<--
first+second=?

first:
146,399,163,403,170,379,147,394,146,399

second:
156,141,136,156,136

-->"""

我正在尝试找到一种方法来捕获列表中的第一个数字和另一个列表中的第二个数字(使用 python，re.findall())。所以我的目标是让python返回一个这样的列表(对于“first:”和“second:”之间的“first”列表:

[146, 399, 163, 403,170,379,147,394,146,399]

不幸的是，我没有设法创建一个正则表达式来捕获用逗号/换行符括起来的一组数字，它们本身被包含在第一个和第二个(或其他)中。这样做时，我只能设法捕获我使用的边界内的第一组或最后一组数字。

这是我使用的错误表达之一。我已经尝试了很多其他方法，并在捕获组和其他东西上使用了量词，但我似乎无法做到正确。

first:.+(\d{2,3}).+second:

我知道首先捕获完整列表并将其拆分会更容易，但我想更好地理解正则表达式，因此我坚持使用它。

编辑:对不起...我应该添加更多的初始字符串，我缩短了太多。问题是，列表分为几行，就像这样(但仍然缩短了):

text = """
<!--
first:
146,399,163,403,170,393,169,391,166,386,170,381,170,371,170,355,169,346,167,335,170,329,170,320,170,
310,171,301,173,290,178,289,182,287,188,286,190,286,192,291,194,296,195,305,194,307,191,312,190,316,
332,155,348,156,353,153,366,149,379,147,394,146,399

second:
156,141,165,135,169,131,176,130,187,134,191,140,191,146,186,150,179,155,175,157,168,157,163,157,159,
77,155,81,148,87,140,96,138,105,141,110,136,111,126,113,129,118,117,128,114,137,115,146,114,155,115,
158,121,157,128,156,134,157,136,156,136
-->
""""

最佳答案

注意 - 在本次编辑中，知识渊博的用户提供了一些答案，但到目前为止，这似乎是唯一一个用一行代码来回答您的问题的答案。

你可以试试这个说法:

x = re.findall(r'(\w+?):\s+((?:\d+,?)+)', text)

当 x 被打印时返回以下数组:

[('first', '146,399,163,403,170,379,147,394,146,399'), ('second', '156,141,136,156,136')]

解释-

这个正则表达式不仅可以像您的问题状态那样找到第一个和第二个，而且如果您的代码在任何时间点包含，说:

third:
123, 124, 12, 1

或者类似的东西，正则表达式甚至可以匹配。

x 返回一个包含两个元组的数组 - 每个元组都有第一个元素作为名称，即 first、second 等等，而每个第二个元素都是实际的数字字符串。

正则表达式字符串开头的 r 表明它是一个原始字符串，基本上放弃了那些讨厌的双反斜杠。
(\w+?) 是第 1 组，它匹配 first、second 等数字之前的文本，甚至您的示例输入包含的其他文本它。
: 表示 first 或 second 之类的文字后面会跟一个冒号，
\s+ 匹配一个或多个空格(在这种情况下，甚至是换行符)
((?:\d+,?)+) 是包含实际数字字符串的第二组
(?:\d+,?) 是一个非捕获组，它告诉正则表达式匹配一个或多个数字(可能后跟逗号)，并且 + 在非捕获组之后表示该序列将重复一次或多次。

哦，还有一件事 -

要访问所需的匹配项 - 无论是标签 first、second 等还是它们各自的数字，您都可以使用:

for match in x:
    print(match[0])
    print(match[1])
    print()

本质上，match 是包含 [0] 处的标签和 [1]

处的数字的元组

编辑 1 -

要捕获您最近指定的多行数字，您可以简单地将 \n? 添加到您的正则表达式中，如下所示:

x = re.findall(r'(\w+?):\s+((?:\d+,?\n?)+)', text)

与旁边的可选空格匹配。但是，有一个问题:打印时，match[1] 看起来像:

146,399,163,403,170,393,169,391,166,386,170,381,170,371,170,355,169,346,167,335,170,329,170,320,170,
310,171,301,173,290,178,289,182,287,188,286,190,286,192,291,194,296,195,305,194,307,191,312,190,316,
332,155,348,156,353,153,366,149,379,147,394,146,399,1111

但是match本身看起来是这样的:

('first', '146,399,163,403,170,393,169,391,166,386,170,381,170,371,170,355,169,346,167,335,170,329,170,320,170,\n310,171,301,173,290,178,289,182,287,188,286,190,286,192,291,194,296,195,305,194,307,191,312,190,316,\n332,155,348,156,353,153,366,149,379,147,394,146,399,1111\n')

对于x的第一个元素。

请注意匹配中存在物理 \n，这会干扰您想要进行的任何算术计算。

关于正则表达式捕获包含在其他字符中的列表中的数字，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/49759790/

28

4

0

文章推荐： nginx - os.execute 是否会在 lua 中阻塞线程？

文章推荐： amazon-web-services - 在 yarn 上运行多个类似的 Spark 提交作业

文章推荐： java - WebApplicationInitializers 类的等效 web.xml ？

文章推荐： python - numpy python 中向量化特征值计算

java - 几个 "ChildException"捕获 block 与一个 "Exception"捕获 block
多个 ChildException catch block 和一个 Exception catch block 之间哪个更好？更好，我的意思是以良好的实践方式。举例说明: public stati
通过测试连接进行Powershell尝试/捕获
我正在尝试将脱机计算机记录在文本文件中，以便以后可以再次运行它们。似乎没有被记录或捕获。 function Get-ComputerNameChange { [CmdletBinding()]
scala - 拦截与尝试/捕获
我正在将 Scala 'try/catch' 测试代码转换为使用 'intercept' 有没有我不应该使用“拦截”的场景？使用 'intercept' 而不是 'try/catch' 的唯一好处是简
erlang - 如何在Erlang中进行尝试/捕获
我对erlang很陌生，我正在尝试使用基本的try/catch语句来工作。我正在使用Webmachine处理一些请求，我真正想做的就是解析一些JSON数据并将其返回。如果JSON数据无效，我只想返回一
delphi - 捕获 'delete'按键
我不知道如何捕获删除按键。我发现在 ASCII 代码表中，它位于 127 位，但是 if (Key = #127) then 却无济于事。然后我检查了 VK_DELETE 的值，它是 47。尝试使用
php - 对所有PDO查询进行一次全局尝试{}捕获{}
我很少在失败时对数据库查询使用唯一的错误消息我经常使用简短的标准消息，例如“数据库错误/失败。请与网站管理员联系”或类似的消息。或自动发送给我我正在寻找一种在PDO中全局设置一次try {}和ca
Java : CompletableFuture 捕获
我有一个变量CompletableFuture completableFuture 。我希望能够使用任何类型的对象来完成它。例如:completableFuture.complete(new Stri
Java 捕获 IOException
我认为这是基本的东西，但我不知道该怎么做。为什么我得到 IOException never throw in body of相应的 try 语句 public static void main(Str
java - 捕获 JSONException
我在此代码中遇到 JSON 异常: JSONObject jObject = new JSONObject(JSONString); pontosUsuario.setIdUsuari
单引号之间的 Perl 捕获
我正在尝试打印出用单引号括起来的文本。 /bin/bash -lc '/home/CASPER_REPORTS/scripts/CASPER_gen_report.sh CASPER_1' /bin/
java - 捕获 IllegalArgumentException？
我这里遇到了一点问题。我想弄清楚如何捕获 IllegalArgumentException。对于我的程序，如果用户输入负整数，程序应该捕获 IllegalArgumentException 并询问用户
java - 捕获 EJBTransactionRolledbackException
我无法理解 EJBTransactionRolledbackException。我有实体: @Entity public class MyEntity { @Id @Generate
.net - 实时网络使用统计监控/捕获？
对于我给自己提出的以下挑战，如果社区的经验给我任何建议，我将不胜感激 - 即，这里有任何关于最佳方法/方向的指示吗？要求允许收集/实时监控从用户 Windows PC 到一组特定 IP 地址(或
exception - 捕获 SAPSQL_DATA_LOSS
我想在我的 ABAP 代码中捕获并处理 SAPSQL_DATA_LOSS。我试过这个: try. SELECT * FROM (rtab_name) AS rtab
java - 捕获 UnsatisfiedLinkError
我知道捕获错误不是一个好的做法，但在这种情况下，这样做很重要。我正在尝试运行一个包含游戏一部分的 jar，但它给了我一个 unsatisfiedlink 错误，但这是有趣的部分:我正在使用这段代码:
java - 捕获 GenericJDBCException
我有一个表单页面，当我保存它时，它会覆盖数据库。表单页面中有一个文本框，允许用户输入 4000 个字符，但如果用户输入的字符超过此值，则会出现以下错误: ERROR 15:54:05 Abstrac
Python键绑定(bind)/捕获
我想知道在python中绑定(bind)键的最简单方法例如，默认的 python 控制台窗口出现并等待，然后在 psuedo -> if key "Y" is pressed: print (
java - 捕获 NumberFormatException
下面是别人写的类。我面临的问题是，当它进入parse method时与 null as the rawString ，它正在扔NumberFormatException 。所以我想做的是，我应该捕
jquery - 捕获/拦截所有鼠标点击
我有一个简单的脚本，可以捕获所有鼠标单击，除非您单击实际有效的内容。链接、Flash 视频等。我如何调整它，以便无论用户点击什么，在视频加载、新页面加载等之前，它都会发送我构建的简单 GET 请求？
当选择列表值更改而没有更改事件时，Jquery 捕获
我有一个带有一些选择列表的表单，当选择某些值时，这些列表将显示/隐藏更多输入字段。问题是大多数用户都是数据输入人员，因此他们在输入数据时大量使用键盘，并且选择列表的 change 事件仅在焦点离开输

首页

博学

6Ren·AI

商城

正则表达式捕获包含在其他字符中的列表中的数字

解释-