python re.split() 可疑结果-6ren

python re.split() 可疑结果

转载作者：行者123 更新时间：2023-12-01 03:18:19

29

4

我是 python 初学者。我对 re.split() 的输出有疑问

text='alpha, beta,,,gamma dela'
In [9]: re.split('(,)+',text)
Out[9]: ['alpha', ',', ' beta', ',', 'gamma dela']

In [11]: re.split('(,+)',text)
Out[11]: ['alpha', ',', ' beta', ',,,', 'gamma dela']

In [7]: re.split('[,]+',text)
Out[7]: ['alpha', ' beta', 'gamma dela']

为什么这些输出不同？请帮助我，非常感谢!

最佳答案

正如 documentation 中指定的那样re.split:

re.split(pattern, string, maxsplit=0, flags=0)

Split string by the occurrences of pattern. If capturing parentheses are used in pattern, then the text of all groups in the pattern are also returned as part of the resulting list. If maxsplit is nonzero, at most maxsplit splits occur, and the remainder of the string is returned as the final element of the list.

捕获组通常使用不包含 ?: 或lookahead/lookbehind 标记的括号 ((..)) 进行描述。所以前两个正则表达式有捕获组:

  (,)+
# ^ ^
  (,+)
# ^  ^

在第一种情况下，捕获组是单个逗号。这意味着使用了最后一次捕获(因此是一个逗号)。在第二种情况((,+))中，它可以捕获多个逗号(正则表达式旨在捕获尽可能多的逗号，因此它在这里捕获所有逗号)。

在最后一种情况下，没有捕获组，因此这意味着分割已完成，并且与模式匹配的文本被完全忽略。

关于python re.split() 可疑结果，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/42252742/

29

4

0

文章推荐： php - 如何划分列表

文章推荐： python - django makemigrations 不起作用

文章推荐： jquery - 将类添加到 td，除了每行的第一列和第二列

文章推荐： python - 过滤具有整数列表的python输出

haskell - 刚性类型变量麻烦/可疑
继this q about GADTs之后，我正在尝试构建一个 EDSL(对于本文中的示例)，但没有 GADT。我已经找到了一些可以避免 AST 数据类型加倍的方法；但相反，它似乎将代码加倍。所以我尝
android - 为什么 LaunchedEffect(true) 可疑？
我正在使用 compose 实现 MVI。为了让我遵循正确的事件循环，我需要通过我的 View 模型传播点击事件，然后观察副作用。我看过一些实现，它们都使用 LaunchedEffect(true)
python - Python-具有“可疑”时间的日志文件二进制搜索
有没有办法使用Python对日志文件中的“可疑时间”进行有效的二进制搜索？我有一个日志文件，其条目如下： 02:38:18 0 RcvTxData - 11 : Telegram receive
php - 如何在运行之前检测异常查询(注入(inject)可疑)？
一些黑客可以访问我的数据库，我将找出漏洞；我无权访问服务器日志。我制作了这段代码来保存文本文件中的可疑查询: function query($query) { $file = 'sqllog.txt'
SqlServer 2005/2008数据库被标记为“可疑”的解决办法
问题背景：日常对Sql Server 2005关系数据库进行操作时，有时对数据库（如：Sharepoint网站配置数据库名Sharepoint_Config）进行些不正常操作如数据库在读写时而无
SQL Server 置疑、可疑、正在恢复等情况分析
1、出错情况有些时候当你重启了数据库服务，会发现有些数据库变成了正在恢复、置疑、可疑等情况，这个时候DBA就会很紧张了，下面是一些在实践中得到证明的方法。在一次重启数据
c - strcpy() 出现段错误(核心转储)错误(可疑)
我在尝试解决这段短代码中的运行时段错误时遇到了麻烦。我怀疑这与代码中使用 system() 和 strcpy() 有关，但由于我没有遇到此类错误的经验，所以我不确定该怎么做，而且到目前为止我还没有找到
java - 无法让 apache nutch 爬行 - 权限和 JAVA_HOME 可疑
我正在尝试按照 NutchTutorial 运行基本爬网: bin/nutch crawl urls -dir crawl -depth 3 -topN 5 所以我已经安装了 Nutch，并使用 So
php - 可疑 IP(64.19.142.11、64.19.142.13 显然来自 Verizon)添加到 CSS 中所有图像 URL 的前面
我注意到，当我通过浏览器打开 CSS 时，我看到我所有的图像都预先设置了一些 IP。它看起来像这样: url(http://64.19.142.11/www.mydomain.com/i/pgBg.p

首页

博学

6Ren·AI

商城

python re.split() 可疑结果