gpt4 book ai didi

用于抓取一行特定部分的 python 正则表达式

转载 作者:太空宇宙 更新时间:2023-11-04 01:03:15 26 4
gpt4 key购买 nike

想要遍历文件中的行并获取其中的某些部分。

线条如下所示 “2584\tM108\tK:14%” “2585\tM108\tK:14%\tN:10%”

我写了以下表达式,但它们似乎让我失望了......首先,我希望捕获 M10* 和 K,并将它们粘在一起,只取 M10* 之后的第一个条目(在上面的示例中为 K)。

Mutation = re.sub(r'.*\t(.*)\t.*:(.*)%.*', r'\1\2', line)

我想要 Mutation = M108K

其次,我想获取没有 % 符号的百分比

Percentage = re.sub(r'.*\t.*\t.*:(.*)%.*', r'\1', line)

我想要百分比 = 14

不太熟练的是写表达式,这些实际上不起作用而且效率低下。感谢任何修复/优化它们的帮助。

最佳答案

我会在一个正则表达式中完成所有这些。 .* 是贪婪的,它尽可能多地吃掉所有字符。因此,您需要通过在 * 旁边添加 ? 量词来使其进行非贪婪匹配。

>>> import re
>>> s = "2584\tM108\tK:14%" "2585\tM108\tK:14%\tN:10%"
>>> re.sub(r'^.*?\t(.*?)\t(.*?):(.*?)%.*', r'\1\2 \3', s)
'M108K 14'

>>> mutation,percentage = re.sub(r'^.*?\t(.*?)\t(.*?):(.*?)%.*', r'\1\2 \3', s).split()
>>> mutation
'M108K'
>>> percentage
'14'

关于用于抓取一行特定部分的 python 正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31863219/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com