elasticsearch - grok 不读带连字符的单词-6ren

elasticsearch - grok 不读带连字符的单词

转载作者：行者123 更新时间：2023-12-04 06:17:35

27

4

这是我的 grok 模式

2017-09-25 08:58:17,861 p=14774 u=ec2-user | 14774 1506329897.86160:检查 any_errors_fatal

我正在尝试阅读用户，但它只给出 ec2 ，它没有给出完整的词

对不起，我是 grok 过滤器的新手

我目前的模式:

%{TIMESTAMP_ISO8601:timestamp} p=%{WORD:process_id} u=%{WORD:user_id}

电流输出:

...
...
...
  "process_id": [
    [
      "14774"
    ]
  ],
  "user_id": [
    [
      "ec2"
    ]
  ]
}

最佳答案

WORD 定义为 "\b\w+\b"
见 https://github.com/logstash-plugins/logstash-patterns-core/blob/master/patterns/grok-patterns

\b 是单词边界

\w 匹配单个字母数字字符(字母字符或十进制数字)或“_”

+ 表示任意数量的前一个字符。所以\w+ 表示任意数量的字符

请注意，\w 不匹配 -

所以为了让它工作而不是 WORD 使用

(?<user_id>\b[\w\-]+\b)

这不使用预定义的 grok 模式，而是使用“原始”正则表达式

使用 (?.....) 而不是 %{ 因为它是“原始”正则表达式

\-表示文字 - 符号

[ ] 表示字符类。所以 [\w-] 将匹配\w 所做的所有事情 - 以及

关于elasticsearch - grok 不读带连字符的单词，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/46402027/

27

4

0

文章推荐： ruby-on-rails - rails 3.1 屈折问题

文章推荐： java - 选择信息丰富的类名

文章推荐： java - Java 中的 DES 实现 : Error during Key Generation Phase

文章推荐： ruby-on-rails - 如何在表单 textarea 中编辑序列化的哈希列

regex - GROK 模式适用于 GROK 调试器，但不适用于 Logstash GROK
我有一个 GROK 模式，我正尝试在 Logstash 中使用它，它在 GROK 调试器中工作 website但不在日志存储中。我尝试了不同的配置但没有成功。我希望有人可以帮助我确定为什么这不起作用。
logstash-grok - Logstash - grok 重命名字段名称
以下是事件消息的示例: { "timestamp":"2016-03-29T22:35:44.770750-0400", "flow_id":45385792, "in_iface":"eth1",
logstash-grok - 可选字段的 GROK 模式
我有一个像这样的日志字符串: 2018-08-02 12:02:25.904 [http-nio-8080-exec-1] WARN o.s.w.s.m.s.DefaultHandlerExcept
logstash-grok - Logstash - grok 重命名字段名称
以下是事件消息的示例: { "timestamp":"2016-03-29T22:35:44.770750-0400", "flow_id":45385792, "in_iface":"eth1",
logstash-grok - 可选字段的 GROK 模式
我有一个像这样的日志字符串: 2018-08-02 12:02:25.904 [http-nio-8080-exec-1] WARN o.s.w.s.m.s.DefaultHandlerExcept
grok - 使用多个 grok 模式为 1 个字段赋值
我的问题是关于如何使用 Grok 模式。我知道给定的现有 Grok 模式，我可以使用以下语法将值分配给字段: %{DATESTAMP_RFC822:timestamp} 我也知道我可以创建自己的自定
tomcat - tomcat 日志的 Grok 模式在 Grok Debugger 上给出编译错误
我正在尝试为 Java 应用程序设置 ELK。 tomcat 日志是使用 log4j 生成的。要编写测试模式，我使用 Grok Debugger .但是在调试器上它总是显示 Compile ERROR
Logstash grok 方括号
我正在尝试使用某种 grok 模式来使用以下日志记录格式: *Sun 07:05:18.372 INFO [main] [userID] perf - 0ms - select x from y 我
regex - GROK 正则表达式捕获组不匹配
我正在尝试学习如何第一次使用 logstash 的 grok 过滤器捕获日志文件中的不同字段，但无法正确解析它。我正在使用 https://grokdebug.herokuapp.com/来测试我的工
elasticsearch - grok 不读带连字符的单词
这是我的 grok 模式 2017-09-25 08:58:17,861 p=14774 u=ec2-user | 14774 1506329897.86160:检查 any_errors_fatal
logstash - 如何加速logstash模式匹配(grok)？
我有一个 200 MB 的日志文件。我将日志文件输入logstash，需要几个小时才能完成工作。我想知道是否有办法加快速度？也许以并行模式运行它？最佳答案您可以看看here关于如何加快速度。 T
Logstash grok 过滤器不适用于最后一个字段
在 Logstash 2.3.3 中，grok 过滤器不适用于最后一个字段。要重现该问题，请创建 test.conf，如下所示: input { file { path => "/Use
logstash - GROK 中的日志级别模式
我是 logstash 和 grok 的新手，对模式有疑问。我正在尝试为我的 apache 错误日志创建一个 grok 模式。但是我对以下行为有点困惑。如果我在 http://grokdebug.h
用于特殊字符的 Logstash grok
以下是我的日志 # Time: 2017-11-02T07:41:22.631956Z# User@Host: root[root] @ localhost [] Id: 我无法为单词 ro
logstash grok 过滤烦恼
2012 年 9 月 27 日星期四 15:30:27 BST:- 无效 token $_POST[custom]，指示金额、用户 ID 这是来 self 尝试使用 grok 解析 logstash
logstash grok 捕获重复模式
我有一个类似于以下的输入 2015-12-02T12:39:57.546461+08:00 222.55.201.19 c): start_time="2015-12-02 ...some other
logstash - GROK 中的日志级别模式
我是 logstash 和 grok 的新手，对模式有疑问。我正在尝试为我的 apache 错误日志创建一个 grok 模式。但是我对以下行为有点困惑。如果我在 http://grokdebug.h
Logstash grok 多次匹配失败
我有这些日志，我试图使用 grok 从每一行中提取多个信息。但似乎有些匹配没有被考虑在内，尽管它们对我来说似乎很好。这是一个示例行: "#wtb# GetSP ok. Referer:http://
regex - Grok - 解析可选字段
我有来自 kafka 的数据，我想将它们发送到 ElasticSearch。我有一个这样的带有标签的日志: APPLI_A|PRF|ENV_1|003 我试图用 grok 解析它使用 grok 调试器
elasticsearch - Grok 没有正确匹配多行日志条目？
几周来我一直在做这件事，但我似乎无法理解这有什么问题。我试图让所有这些行适应与 grok 的多行匹配，但它只选择最后一行，甚至丢弃行开头的数字。 11:31:03.936 5: Loa

首页

博学

6Ren·AI

商城

elasticsearch - grok 不读带连字符的单词