regex - Grok - 解析可选字段-6ren

regex - Grok - 解析可选字段

转载作者：行者123 更新时间：2023-12-01 09:20:10

我有来自 kafka 的数据，我想将它们发送到 ElasticSearch。我有一个这样的带有标签的日志:

<TOTO><ID_APPLICATION>APPLI_A|PRF|ENV_1|00</ID_APPLICATION><TN>3</TN></TOTO>

我试图用 grok 解析它使用 grok 调试器:

\<ID_APPLICATION\>%{WORD:APPLICATION}\|%{WORD:PROFIL}\|%{WORD:ENV}\|%{WORD:CODE}\</ID_APPLICATION\>\<TN\>%{NUMBER:TN}\</TN\>

它有效，但有时日志有一个像这样的新字段(带有标签 <TP> 的字段):

<TOTO><ID_APPLICATION>APPLI_A|PRF|ENV_1|00</ID_APPLICATION><TN>3</TN><TP>new</TP></TOTO>

我想得到带有这个字段(TP 标签)的行和不带的行。我怎样才能做到这一点？

最佳答案

如果您有一个可选字段，您可以将它与一个可选的命名捕获组匹配:

(?:<TP>%{WORD:TP}</TP>)?
^^^                    ^

非捕获组在内存中不保存任何子匹配项，仅用于分组， ?量词匹配 1 次或 0 次(=可选)。它将创建一个 TP具有 word 类型值的字段。如果该字段不存在，则值为 null .

因此，整个模式将如下所示:

<ID_APPLICATION>%{WORD:APPLICATION}\|%{WORD:PROFIL}\|%{WORD:ENV}\|%{WORD:CODE}</ID_APPLICATION><TN>%{NUMBER:TN}</TN>(?:<TP>%{WORD:TP}</TP>)?

关于regex - Grok - 解析可选字段，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34747235/

文章推荐： d3.js - cubism.js 的色带

文章推荐： r - r中的订购日期问题

generics - Swift 泛型函数(n 选 k)
我正在尝试用 Swift 编写这段 JavaScript 代码:k_combinations 到目前为止，我在 Swift 中有这个: import Foundation import Cocoa e

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章