gpt4 book ai didi

AWK 中的正则表达式不接受惰性选择

转载 作者:行者123 更新时间:2023-12-02 07:31:25 25 4
gpt4 key购买 nike

我有以下文本文件,我想从中提取“NAME=”和第一个“,”或“)”字符之间的内容。

  AZTBCM         = (CURVE=(NAME=AZTBCM), -SOME TEXT
B08M = (CURVE=(NAME=B08M), - SOME TEXT
YMOD = (CURVE=(NAME=YMOD), - SOME TEXT
ZCCP = (CURVE=(NAME=ZCCP, CURVE TYPE= GAMMA), - SOME TEXT

然而,在 gensub 中,字符范围和惰性选择并不像在 say nedit 中那样工作。在下面的 awk 脚本文件中,您可以找到我尝试过的不同行

#! /bin/awk -f
{name=gensub(/.*NAME=(.*?)[,)].*/,"\\1","g",$0); print "line1 "name} #line1
{name=gensub(/.*NAME=([:alnum:]*?)[,)].*/,"\\1","g",$0); print "line2 "name} #line2
{name=gensub(/.*NAME=([0-z ]*?)[,)].*/,"\\1","g",$0); "line3 "print name} #line3
{name=gensub(/.*NAME=([0-z Z]*?)[,)].*/,"\\1","g",$0); "line4 "print name} #line4
{name=gensub(/.*NAME=([0-Z0-9]*?)[,)].*/,"\\1","g",$0); "line5 "print name} #line5

这会产生以下内容:

line1 AZTBCM)
line2 AZTBCM = (CURVE=(NAME=AZTBCM), -SOME TEXT
line3 AZTBCM = (CURVE=(NAME=AZTBCM), -SOME TEXT
line4 AZTBCM
line5 AZTBCM
line1 B08M)
line2 B08M = (CURVE=(NAME=B08M), - SOME TEXT
line3 B08M
line4 B08M
line5 B08M
line1 YMOD)
line2 YMOD = (CURVE=(NAME=YMOD), - SOME TEXT
line3 YMOD
line4 YMOD
line5 YMOD
line1 ZCCP, CURVE TYPE= GAMMA)
line2 ZCCP = (CURVE=(NAME=ZCCP, CURVE TYPE= GAMMA), - SOME TEXT
line3 ZCCP = (CURVE=(NAME=ZCCP, CURVE TYPE= GAMMA), - SOME TEXT
line4 ZCCP
line5 ZCCP

第 1 行仅返回包含“)”的名称。我的懒惰限定符应该可以防止这种情况发生。 Nedit 使用相同的选择/替换只给出名称。查看 ZCCP 案例,它甚至似乎继续捕获并包括最后一个括号。

第 2 行未返回匹配项,因此返回 $0。也无法在 Nedit 中使用它。(似乎不受支持,没关系)

第 3 行应取零以降低 ascii 表的 z。这对我来说是最奇怪的失败。因为我加载了更多的行,所以只有在名称中有 Z 时才会失败。甚至像我的字符范围内的终止字符这样的小写字母也不行。

第 4 行我添加了空格和 Z(实际上不需要空格)以查看字符范围是否由于某种未知原因而遗漏了它。似乎有一个,因为它现在又可以工作了。忘记第 5 行 :)

任何人都可以主要阐明这种捕获在第一行的情况下是如何工作的吗?我不明白为什么它会插入第一个括号。其次,为什么我的字符范围不包括“Z”?

干杯,罗伯特

PS 这个问题似乎有两个问题。所以我更改了这篇文章的标题,以明确回答什么。

最佳答案

您可能没有尝试使用惰性量词,而是使用了否定字符类。说:

awk '{name=gensub(/.*NAME=([^,)]*).*/,"\\1","g",$0); print "line1 "name}' filename

将为您的输入生成以下内容:

line1 AZTBCM
line1 B08M
line1 YMOD
line1 ZCCP

关于AWK 中的正则表达式不接受惰性选择,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21310040/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com