gpt4 book ai didi

python - Python 中的参数化正则表达式

转载 作者:太空宇宙 更新时间:2023-11-03 12:43:13 25 4
gpt4 key购买 nike

在 Python 中,有没有比像这样手动将字符串参数化为正则表达式更好的方法:

test = 'flobalob'
names = ['a', 'b', 'c']
for name in names:
regexp = "%s" % (name)
print regexp, re.search(regexp, test)

这个 noddy 示例尝试依次匹配每个名称。我知道有更好的方法可以做到这一点,但这是一个纯粹为了说明这一点的简单示例。


答案似乎是否定的,没有真正的选择。在 python 中参数化正则表达式的最佳方法是如上所述或使用诸如 str.format() 之类的衍生物。 . 我试图写一个通用的问题,而不是'fix ma codez, kthxbye'。对于那些仍然感兴趣的人,我在这里充实了一个更接近我的需要的例子:

for diskfilename in os.listdir(''):
filenames = ['bob.txt', 'fred.txt', 'paul.txt']
for filename in filenames:
name, ext = filename.split('.')
regexp = "%s.*\.%s" % (name, ext)
m = re.search(regexp, diskfilename)
if m:
print diskfilename, regexp, re.search(regexp, diskfilename)
# ...

我试图根据文件名找出文件的“类型”,格式为 <filename>_<date>.<extension> .在我的真实代码中,filenames array 是一个字典,包含一个在找到匹配项后调用的函数。

我考虑过的其他方式:

  • 在数组中有一个正则表达式。我已经有了一个没有任何正则表达式魔术的文件名数组,所以我不愿意这样做。我已经在我的代码的其他地方这样做了,但它一团糟(尽管在那里是必要的)。

  • 仅匹配文件名的开头。这会起作用,但会破坏文件的 .bak 副本等。在某些时候我可能想要提取日期来自文件名,因此无论如何都需要使用正则表达式。


感谢建议替代正则表达式以获得相同最终结果的回复。我对现在和将来的参数化正则表达式更感兴趣。我从来没有遇到过 fnmatch,所以从长远来看它都很有用。

最佳答案

好吧,当您从字符串构建正则表达式时,我看不到其他方法。但是您可以用字典参数化字符串本身:

d = {'bar': 'a', 'foo': 'b'}
regexp = '%(foo)s|%(bar)s' % d

或者,根据问题,您可以使用列表理解:

vlist = ['a', 'b', 'c']
regexp = '|'.join([s for s in vlist])

编辑: Mat 澄清了他的问题,这让事情变得不同,上面提到的完全不相关。

我可能会采用这样的方法:

filename = 'bob_20090216.txt'

regexps = {'bob': 'bob_[0-9]+.txt',
'fred': 'fred_[0-9]+.txt',
'paul': 'paul_[0-9]+.txt'}

for filetype, regexp in regexps.items():
m = re.match(regexp, filename)
if m != None:
print '%s is of type %s' % (filename, filetype)

关于python - Python 中的参数化正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/554957/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com