Logstash grok 过滤器帮助 - 固定位置文件-6ren

Logstash grok 过滤器帮助 - 固定位置文件

转载作者：行者123 更新时间：2023-12-04 17:09:27

25

4

我有一个固定位置(列)文件，其中没有分隔字段的分隔符。每个字段都有自己的起始位置和长度。以下是数据示例:

520140914191193386---------7661705508623855646---1595852965---133437--the lazy fox jumping over-----------------------212.75.12.85---

虽然我使用破折号 (-) 来显示上面的数据示例，但如果实际字段比架构中允许的字段短，则实际文件包含空格。

这种情况下的架构是:

UsedID (start position 1, length 27)
SystemID (start position 28, length 22)
SampleID (start position 50, length 13)
LineID (start position 63, length 8)
Text (start position 71, length 48)
IP (start position119, length 15)

理想情况下，我会在 logstash 中获得以下字段值(没有尾随空格)

UsedID:520140914191193386
SystemID:7661705508623855646
SampleID:1595852965
LineID:133437
Text:the lazy fox jumping over
IP:212.75.12.85

我如何用 grok 解析这种文件？

最佳答案

我会去一个两步过程:

将数据拆分为字段

从每个字段的末尾去除空数据

由于每个字段的长度已知，您可以使用正则表达式模式，如 .{27}来匹配它们。

在 grok 中，您可以像这样命名一个字段: (?<user_id>.{27})
您可以在 grok debugger 中测试完整模式，但这样的事情应该实现基于长度的拆分:

(?<user_id>.{27})(?<system_id>.{22})(?<sample_id>.{13})(?<line_id>.{8})(?<text>.{48})(?<ip>.{15})

你提到你的额外字符都是空格，所以你可以使用 mutate filter 清理它。与 strip option .

总之，这可能看起来像这样:

filter {
    grok {
        match => ["message", "(?<user_id>.{27})(?<system_id>.{22})(?<sample_id>.{13})(?<line_id>.{8})(?<text>.{48})(?<ip>.{15})"]
    }

    mutate {
        strip => [
            "user_id",
            "system_id",
            "sample_id",
            "line_id",
            "text",
            "ip"
        ]
    }
}

关于Logstash grok 过滤器帮助 - 固定位置文件，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/25837782/

25

4

0

文章推荐： regex - R 包含句号的字符串的正则表达式

文章推荐： protractor - 如何检查是否在 Protractor 的列中找到文本

文章推荐： .net - Quartz Scheduler - 触发器不引用给定的作业

logstash - logstash 中的日志轮换
我在 logstash 中使用文件作为日志的输入。我的日志文件每天轮换，所以我想问一下我们如何配置 logstash 的文件插件，以便它可以处理每天轮换的文件。除此之外，文件节拍也可以进行日志轮换。
logstash - Logstash 是否对每个事件消息有限制大小？
我正在我公司服务的服务器上实现监控工具。为此，我正在使用 logstash。我们的应用程序通过 log4net udp appender 将它们的日志发送到 logstash(输入 udp)，然后 l
logstash - Logstash 中的数学函数
我期待对 Logstash 中收到的输入使用数学运算，但无法看到任何此类过滤器 . 输入如下: { "user_id": "User123", "date": "2016 Jun 26 12
logstash - logstash 可以同时处理多个输出吗？
我对 logstash 和 Elasticsearch 很陌生。我正在尝试将日志文件存储在 elasticsearch 和平面文件中。我知道 logstash 支持两种输出。但是它们是同时处理的吗？还
logstash - Logstash 过滤器入门
寻求一些入门帮助...我已经安装了 Logstash(以及 ElasticSearch)，但我正在为我的第一个过滤器而苦苦挣扎。作为测试，我将其配置为从包含 6 行的修剪日志文件中读取，每行以时间戳
logstash - Logstash 设置建议
我已经按照下面提到的架构实现了 logstash(在测试中)。成分分解 Rsyslog 客户端:默认情况下，所有 Linux destros 中都安装了 syslog，我们只需要配置 rsyslog
logstash - logstash 配置中的负正则表达式
我无法在 LogStash 中使用负正则表达式(如 the docs 中所述) 考虑以下正则表达式，它可以正常工作以检测已分配值的字段: if [remote_ip] =~ /(.+)/ {
logstash - Filebeat 无法连接到 logstash
我在云中使用两台服务器，在一台服务器上 (A) 我安装了 filebeat，在第二台服务器上 (B) 我安装了 logstash、elasticsearch 和 kibana。所以我在 logstas
logstash - 如何替换 Logstash 中字段中的字符串
我有一个来自 Windows 事件日志的 IP 地址字段，它在 IP 地址前面包含类似“::fffff:”的字符。我无法在此处更改源，因此我必须在 Logstash 中修复此问题。我一定很不擅长谷歌
logstash - 访问 logstash 中的数组元素
我正在尝试将此日期结构 YYYY-MM-DD_HH-MM-SS 转换为 logstash 中的 YYYY-MM-DD HH:MM:SS。这是我的过滤器: filter { csv {
logstash - 在 Logstash 中提取字段
我正在使用 Logstash(以 Kibana 作为 UI)。我想从我的日志中提取一些字段，以便我可以在 UI 的 LHS 上按它们进行过滤。我日志中的示例行如下所示: 2013-07-04 00:
logstash - 使用不区分大小写的 Logstash 过滤器
如何将此 Logstash 过滤器更改为不区分大小写？ filter { if "foo" in [message] { mutate { add_field => { "Alert_le
logstash - 如何让 logstash 删除与一组正则表达式不匹配的所有事件？
我正在尝试将事件消息与几个正则表达式相匹配。我打算使用 grep 过滤器，但它已被弃用，所以我正在尝试使用否定的方法。我正在寻找的功能是删除所有事件，除非消息匹配多个正则表达式。过滤器波纹管不起作
logstash - 将 logstash 作为服务运行并查看标准输出
我用过logstash的RPM安装。因此，logstash 作为 linux 服务运行。我想调试一个管道，需要查看的内容 output { stdout { codec => rubydebug
logstash - 如何在 Logstash 中比较日期
如何在 logstash 中比较日期。我想将日期与恒定日期值进行比较。以下代码在 Logstash 中失败并出现 ruby 异常。 if [start_dt] { "str_dt" => "20
logstash - 如何将选定的日志发送到 Logstash 输出
我正在从logstash-1.1.3升级到logstash-1.3.3。问题是，1.1.3 中的标签和字段配置在 1.3.3 版本中已弃用。这些允许仅将那些事件发送到具有给定标签或包含给定字段的输出。
logstash - 在同一台机器上运行两个 logstash 实例
我想在同一台机器上运行两个 logstash 实例。现在我使用命令启动 logstash。logstash.bat agent -f logstashconf.conf。但是当我要通过相同的命令启动第
logstash - 使用 grok 进行条件匹配以用于 logstash
我有这种格式的 php 日志 [Day Mon DD HH:MM:SS YYYY] [Log-Type] [client ] : [Day Mon DD HH:MM:SS YYYY] [Log-Ty
logstash - Logstash HTTP 输出插件中的 UnknownException
我的 logstash 中的一些请求使 http 输出插件失败，并且日志显示 [2020-10-16T18:44:54,574][ERROR][logstash.outputs.http ] [HTT
logstash - 如何使用Logstash插件-logstash-input-http
我正在探索Logstash来接收HTTP上的输入。我已经使用以下方法安装了http插件: 插件安装logstash-input-http 安装成功。然后我尝试使用以下命令运行logstash: log

首页

博学

6Ren·AI

商城

Logstash grok 过滤器帮助 - 固定位置文件