gpt4 book ai didi

python - 正则表达式 Python 数据操作——NoneType 对象

转载 作者:行者123 更新时间:2023-12-01 05:56:03 26 4
gpt4 key购买 nike

我有一个 .txt 文件,其中包含以下格式的数据:

pq1000007 35 2 237493054 0.013328573 

我正在尝试使用正则表达式来捕获第一个、第三个和最后一个数字,但前提是最后一个数字大于 0.4。由于某种原因,我收到消息“NoneType 对象没有属性‘组’”。有什么想法吗?

代码:

InFileName = "PerkQP_CHGV_SCZ.txt"
InFile = open(InFileName, 'r')

OutFileName='PAZ_OUT' + ".txt"
OutFile=open(OutFileName, 'w')


for Line in InFile:
match = re.search('(\w+)\s\d+\s(\d+)\s\d+\d+\s(\d+\.\d+)', Line)
if match.group(2) > 0.4:
c = match.group()
print(c)
OutFile.write(c+"\n")

InFile.close()
OutFile.close()

最佳答案

一些问题:

正则表达式匹配是一个字符串,因此您无法将其与 float 进行有意义的比较(事实上,在 Python 3 中,这样做是非法的)。在 Python 2 中,任何字符串都会比较大于 float (因为 ASCII 中的 "str" 高于 "float"。是的,这个规则没有意义。好。 Python 3 取消了它)。

然后,该正则表达式中的最后一个数字位于第三捕获组中,因此您需要这样做

if float(match.group(3)) > 0.4:

然后,您应该在正则表达式中使用逐字字符串 (r"...")。

最后,\d+\d+ 当然是多余的,\d+ 就可以了。

match = re.search(r'(\w+)\s\d+\s(\d+)\s\d+\s(\d+\.\d+)', Line)

此正则表达式与您提供的示例行匹配,因此您的错误消息(表示不匹配)必须具有不同的来源。也许您的文件中某处有一行与正则表达式不匹配。在这种情况下,您可以像这样构建您的程序:

for Line in InFile:
match = re.search(r'(\w+)\s\d+\s(\d+)\s\d+\s(\d+\.\d+)', Line)
if match:
if float(match.group(3)) > 0.4:
# do stuff
else:
print "No match: ", Line

关于python - 正则表达式 Python 数据操作——NoneType 对象,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12556632/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com