gpt4 book ai didi

regex - Gawk regexp 选择序列

转载 作者:行者123 更新时间:2023-12-04 23:18:35 25 4
gpt4 key购买 nike

很抱歉关于正则表达式的第 n 个简单问题,但如果没有在我看来太复杂的解决方案,我无法得到我需要的东西。我正在解析一个只包含 3 个字母 A、E、D 序列的文件,如
AADDEEDDAEEEEEEEEAEEEDEEAAEEEDDAAA
我只想识别那些以 E 开头并以 D 结尾的序列,例如在
EDDDDDDDDEEEDDDDDDEEEEEEEED
我正在与正确的正则表达式作斗争来做到这一点。这是我最后一次尝试
echo "1,AAEDDEED,1\n2,EEEEDDDD,2\n3,EDEDEDED" | gawk -F, '{if($2 ~ /^E[(ED){1,1}]*D$/ && $2 !~ /^E[(ED){2,}]*D$/) print $0}'
这不起作用。有什么帮助吗?

提前致谢。

最佳答案

如果我理解正确你的要求一个简单的

awk '/^E+D+$/' file.input

会做的伎俩。

更新 :如果行格式包含前/后数字(后可选),如示例后面所示,这可能是纯正则表达式改编(替代使用字段开关 -F, ):
awk '/^[0-9]+,E+D+(,[0-9]+)?$/' input.test

关于regex - Gawk regexp 选择序列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33659423/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com