gpt4 book ai didi

python替代正则表达式搜索返回无的元组

转载 作者:行者123 更新时间:2023-11-28 17:57:35 25 4
gpt4 key购买 nike

我有以下脚本,它获取 tnsfiles 的 service_name(如果可用),如果不可用,则获取 SID它似乎工作正常但它返回我无法解析的元组

#!/usr/bin/env python

import re

regexes = re.compile(r'SERVICE_NAME\s?=\s?(.+?)\)|SID\s?=\s?(.+?)\)')

with open('tnsnames.ora.test') as tns_file:
for tnsname in tns_file:
match = regexes.search(tnsname)

if match:
print(match.groups())

脚本返回以下内容:

(None, 'db1')
('db2', None)
('db3', None)

但我只想返回数据库的名称而不是 None

如何从输出中去除“无”。我不能使用 re.findall,因为 tnsnames 中有些行有 service_name 和 sid,然后我会有重复项。

如何解析匹配正则表达式对象的输出以忽略无?

最佳答案

您正在使用 .groups()返回所有捕获值的方法,即使它们为空。由于正则表达式包含一个交替,每个交替中都有一个捕获组,因此在有效匹配时,其中一个将始终为空。

通用解决方案是从两项元组中过滤掉None 值,您可以使用a lot of approaches 来做到这一点。 .一种方法是连接两个值:

m = match.groups()
print(r'{}{}'.format(m[0] or '', m[1] or ''))

m[x] or ''这里的语法是可以的,因为我们只能有一个字符串或 Nonematch.groups() .

另一种解决方案是重写模式,使其只包含一个捕获组

很容易使模式包含单个组,因为括号之间的部分匹配在两种选择中都是重复的:

r'(?:SERVICE_NAME|SID)\s*=\s*([^)\r\n]+)'
^^^^^^^^^^^^^^^^^^^^

参见 regex demoregex graph :

enter image description here

详情

  • (?:SERVICE_NAME|SID) - 一个 non-capturing group匹配 SERVICE_NAMESID
  • \s*=\s* - 一个 =用 0+ 个空格括起来
  • ([^)\r\n]+) - 第 1 组:任何字符,一次或多次出现,) 除外, CR 和 LF(由于原始尝试中的 . 而被排除)。

关于python替代正则表达式搜索返回无的元组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57475670/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com