nginx日志导入elasticsearch的方法示例-6ren

nginx日志导入elasticsearch的方法示例

转载作者：qq735679552 更新时间：2022-09-29 22:32:09

CFSDN坚持开源创造价值，我们致力于搭建一个资源共享平台，让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章nginx日志导入elasticsearch的方法示例由作者收集整理，如果你对这篇文章有兴趣，记得点赞哟.

将nginx日志通过filebeat收集后传入logstash，经过logstash处理后写入elasticsearch。filebeat只负责收集工作，logstash完成日志的格式化，数据的替换，拆分，以及将日志写入elasticsearch后的索引的创建.

1、配置nginx日志格式。

 
    ? 
   
         log_format main     
         '$remote_addr $http_x_forwarded_for [$time_local] $server_name $request ' 
        
         '$status $body_bytes_sent $http_referer ' 
        
         '"$http_user_agent" ' 
        
         '"$connection" ' 
        
         '"$http_cookie" ' 
        
         '$request_time ' 
        
         '$upstream_response_time' 
         ;

2、安装配置filebeat，启用nginx module 。

 
    ? 
   
         tar 
         -zxvf filebeat-6.2.4-linux-x86_64. 
         tar 
         .gz -C  
         /usr/local 
        
         cd 
         /usr/local 
         ; 
         ln 
         -s filebeat-6.2.4-linux-x86_64 filebeat 
        
         cd 
         /usr/local/filebeat

启用nginx模块。

 
    ? 
   
         . 
         /filebeat 
         modules  
         enable 
         nginx

查看模块。

 
    ? 
   
         . 
         /filebeat 
         modules list

创建配置文件。

 
    ? 
   
         vim  
         /usr/local/filebeat/blog_module_logstash 
         .yml 
        
         filebeat.modules: 
        
         - module: nginx 
        
         access: 
        
         enabled:  
         true 
        
         var.paths: [ 
         "/home/weblog/blog.cnfol.com_access.log" 
         ] 
        
         #error: 
        
         # enabled: true 
        
         # var.paths: ["/home/weblogerr/blog.cnfol.com_error.log"] 
        
         output.logstash: 
        
         hosts: [ 
         "192.168.15.91:5044" 
         ]

启动filebeat 。

 
    ? 
   
         . 
         /filebeat 
         -c blog_module_logstash.yml -e

3、配置logstash 。

 
    ? 
   
         tar 
         -zxvf logstash-6.2.4. 
         tar 
         .gz  
         /usr/local 
        
         cd 
         /usr/local 
         ; 
         ln 
         -s logstash-6.2.4 logstash 
        
         创建一个nginx日志的pipline文件 
        
         cd 
         /usr/local/logstash

logstash内置的模板目录。

 
    ? 
   
         vendor/bundle/jruby/2.3.0/gems/logstash-patterns-core-4.1.2/patterns

编辑 grok-patterns 添加一个支持多ip的正则。

 
    ? 
   
         FORWORD (?:%{IPV4}[,]?[ ]?)+|%{WORD}

官方grok 。

http://grokdebug.herokuapp.com/patterns# 。

创建logstash pipline配置文件。

 
    ? 
   
         #input { 
        
         # stdin {} 
        
         #} 
        
         # 从filebeat接受数据 
        
         input { 
        
         beats { 
        
         port => 5044 
        
         host =>  
         "0.0.0.0" 
        
         } 
        
         } 
        
         filter { 
        
         # 添加一个调试的开关 
        
         mutate{add_field => { 
         "[@metadata][debug]" 
         => 
         true 
         }} 
        
         grok { 
        
         # 过滤nginx日志 
        
         #match => { "message" => "%{NGINXACCESS_TEST2}" } 
        
         #match => { "message" => '%{IPORHOST:clientip} # (?<http_x_forwarded_for>[^\#]*) # \[%{HTTPDATE:[@metadata][webtime]}\] # %{NOTSPACE:hostname} # %{WORD:verb} %{URIPATHPARAM:request} HTTP/%{NUMBER:httpversion} # %{NUMBER:response} # (?:%{NUMBER:bytes}|-) # (?:"(?:%{NOTSPACE:referrer}|-)"|%{NOTSPACE:referrer}|-) # (?:"(?<http_user_agent>[^#]*)") # (?:"(?:%{NUMBER:connection}|-)"|%{NUMBER:connection}|-) # (?:"(?<cookies>[^#]*)") # %{NUMBER:request_time:float} # (?:%{NUMBER:upstream_response_time:float}|-)' } 
        
         #match => { "message" => '(?:%{IPORHOST:clientip}|-) (?:%{TWO_IP:http_x_forwarded_for}|%{IPV4:http_x_forwarded_for}|-) \[%{HTTPDATE:[@metadata][webtime]}\] (?:%{HOSTNAME:hostname}|-) %{WORD:method} %{URIPATHPARAM:request} HTTP/%{NUMBER:httpversion} %{NUMBER:response} (?:%{NUMBER:bytes}|-) (?:"(?:%{NOTSPACE:referrer}|-)"|%{NOTSPACE:referrer}|-) %{QS:agent} (?:"(?:%{NUMBER:connection}|-)"|%{NUMBER:connection}|-) (?:"(?<cookies>[^#]*)") %{NUMBER:request_time:float} (?:%{NUMBER:upstream_response_time:float}|-)' } 
        
         match => {  
         "message" 
         =>  
         '(?:%{IPORHOST:clientip}|-) %{FORWORD:http_x_forwarded_for} \[%{HTTPDATE:[@metadata][webtime]}\] (?:%{HOSTNAME:hostname}|-) %{WORD:method} %{URIPATHPARAM:request} HTTP/%{NUMBER:httpversion} %{NUMBER:response} (?:%{NUMBER:bytes}|-) (?:"(?:%{NOTSPACE:referrer}|-)"|%{NOTSPACE:referrer}|-) %{QS:agent} (?:"(?:%{NUMBER:connection}|-)"|%{NUMBER:connection}|-) %{QS:cookie} %{NUMBER:request_time:float} (?:%{NUMBER:upstream_response_time:float}|-)' 
         } 
        
         } 
        
         # 将默认的@timestamp(beats收集日志的时间)的值赋值给新字段@read_tiimestamp 
        
         ruby {  
        
         #code => "event.set('@read_timestamp',event.get('@timestamp'))" 
        
         #将时区改为东8区 
        
         code =>  
         "event.set('@read_timestamp',event.get('@timestamp').time.localtime + 8*60*60)" 
        
         } 
        
         # 将nginx的日志记录时间格式化 
        
         # 格式化时间 20/May/2015:21:05:56 +0000 
        
         date 
         { 
        
         locale =>  
         "en" 
        
         match => [ 
         "[@metadata][webtime]" 
         , 
         "dd/MMM/yyyy:HH:mm:ss Z" 
         ] 
        
         } 
        
         # 将bytes字段由字符串转换为数字 
        
         mutate { 
        
         convert => { 
         "bytes" 
         =>  
         "integer" 
         } 
        
         } 
        
         # 将cookie字段解析成一个json 
        
         #mutate { 
        
         # gsub => ["cookies",'\;',','] 
        
         #}  
        
         # 如果有使用到cdn加速http_x_forwarded_for会有多个ip，第一个ip是用户真实ip 
        
         if 
         [http_x_forwarded_for] =~  
         ", " 
         { 
        
         ruby { 
        
         code =>  
         'event.set("http_x_forwarded_for", event.get("http_x_forwarded_for").split(",")[0])' 
        
         } 
        
         } 
        
         # 解析ip，获得ip的地理位置 
        
         geoip { 
        
         source 
         =>  
         "http_x_forwarded_for" 
        
         # # 只获取ip的经纬度、国家、城市、时区 
        
         fields => [ 
         "location" 
         , 
         "country_name" 
         , 
         "city_name" 
         , 
         "region_name" 
         ]  
        
         } 
        
         # 将agent字段解析,获得浏览器、系统版本等具体信息 
        
         useragent { 
        
         source 
         =>  
         "agent" 
        
         target =>  
         "useragent" 
        
         } 
        
         #指定要删除的数据 
        
         #mutate{remove_field=>["message"]} 
        
         # 根据日志名设置索引名的前缀 
        
         ruby { 
        
         code =>  
         'event.set("@[metadata][index_pre]",event.get("source").split("/")[-1])' 
        
         }  
        
         # 将@timestamp 格式化为2019.04.23 
        
         ruby { 
        
         code =>  
         'event.set("@[metadata][index_day]",event.get("@timestamp").time.localtime.strftime("%Y.%m.%d"))' 
        
         } 
        
         # 设置输出的默认索引名 
        
         mutate { 
        
         add_field => { 
        
         #"[@metadata][index]" => "%{@[metadata][index_pre]}_%{+YYYY.MM.dd}" 
        
         "[@metadata][index]" 
         =>  
         "%{@[metadata][index_pre]}_%{@[metadata][index_day]}" 
        
         } 
        
         } 
        
         # 将cookies字段解析成json 
        
         # mutate { 
        
         # gsub => [ 
        
         #  "cookies", ";", ",", 
        
         #  "cookies", "=", ":" 
        
         # ] 
        
         # #split => {"cookies" => ","} 
        
         # } 
        
         # json_encode { 
        
         # source => "cookies" 
        
         # target => "cookies_json" 
        
         # } 
        
         # mutate { 
        
         # gsub => [ 
        
         #  "cookies_json", ',', '","', 
        
         #  "cookies_json", ':', '":"' 
        
         # ] 
        
         # } 
        
         # json { 
        
         # source => "cookies_json" 
        
         # target => "cookies2" 
        
         # } 
        
         # 如果grok解析存在错误，将错误独立写入一个索引 
        
         if 
         "_grokparsefailure" 
         in 
         [tags] { 
        
         #if "_dateparsefailure" in [tags] { 
        
         mutate { 
        
         replace => { 
        
         #"[@metadata][index]" => "%{@[metadata][index_pre]}_failure_%{+YYYY.MM.dd}" 
        
         "[@metadata][index]" 
         =>  
         "%{@[metadata][index_pre]}_failure_%{@[metadata][index_day]}" 
        
         } 
        
         } 
        
         # 如果不存在错误就删除message 
        
         } 
         else 
         { 
        
         mutate{remove_field=>[ 
         "message" 
         ]} 
        
         } 
        
         } 
        
         output { 
        
         if 
         [@metadata][debug]{ 
        
         # 输出到rubydebuyg并输出metadata 
        
         stdout{codec => rubydebug{metadata =>  
         true 
         }} 
        
         } 
         else 
         { 
        
         # 将输出内容转换成 "." 
        
         stdout{codec => dots}  
        
         # 将输出到指定的es 
        
         elasticsearch { 
        
         hosts => [ 
         "192.168.15.160:9200" 
         ] 
        
         index =>  
         "%{[@metadata][index]}" 
        
         document_type =>  
         "doc" 
        
         }  
        
         } 
        
         }

启动logstash 。

 
    ? 
   
         nohup 
         bin 
         /logstash 
         -f test_pipline2.conf &

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持我.

原文链接：http://www.zhengdazhi.com/archives/1744 。

最后此篇关于nginx日志导入elasticsearch的方法示例的文章就讲到这里了,如果你想了解更多关于nginx日志导入elasticsearch的方法示例的内容请搜索CFSDN的文章或继续浏览相关文章，希望大家以后支持我的博客！。

文章推荐： keepalived+nginx高可用实现方法示例

文章推荐： nginx 平滑重启的实现方法

文章推荐：配置Nginx的防盗链的操作方法

文章推荐：详解Nginx 静态文件服务配置及优化

IPv6 示例 Wireshark 示例
这个问题在这里已经有了答案: 关闭 11 年前。 Possible Duplicate: Sample data for IPv6? 除了 wireshark 在其网站上提供的内容之外，是否有可以下
c# - WPF 中的多拖放——示例/示例/教程？
我正在寻找可以集成到现有应用程序中并使用多拖放功能的示例或任何现成的解决方案。我在互联网上找到的大多数解决方案在将多个项目从 ListBox 等控件拖放到另一个 ListBox 时效果不佳。谁能指出我
java - GATE Embedded 示例示例 NoClassFound 错误
我是 GATE Embedded 的新手，我尝试了简单的示例并得到了 NoClassDefFoundError。首先我会解释我尝试了什么在 D:\project\gate-7.0 中下载并提取 Ga
eclipse-rcp - Eclipse 中的 JFace 示例，如 SWT 示例？
是否有像 Eclipse 中的 SWT 示例那样的多合一 JFace 控件示例？搜索(在 stackoverflow.com 上使用谷歌搜索和搜索)对我没有帮助。如果它是一个独立的应用程序或 ecl
google-compute-engine - Google 计算引擎 .NET API 示例/示例/教程
我找不到任何可以清楚地解释如何通过 .net API(特别是 c#)使用谷歌计算引擎的内容。有没有人可以指点我什么？附言我知道 API 引用 ( https://developers.google.
基于Basicauth的一个C#示例
最近在做公司的一个项目时，客户需要我们定时获取他们矩阵系统的数据。在与客户进行对接时，提到他们的接口使用的目前不常用的BASIC 认证。天呢，它好不安全，容易被不法人监听，咋还在使用呀。但是没办法呀，
基于Basicauth的一个C#示例
最近在做公司的一个项目时，客户需要我们定时获取他们矩阵系统的数据。在与客户进行对接时，提到他们的接口使用的目前不常用的BASIC 认证。天呢，它好不安全，容易被不法人监听，咋还在使用呀。但是没办法呀，
YAML 示例
我正在尝试为我的应用程序设计配置文件格式并选择了 YAML。但是，这(显然)意味着我需要能够定义、解析和验证正确的 YAML 语法! 在配置文件中，必须有一个名为 widgets 的集合/序列。 .这
python - 示例
你能给我一个使用 pysmb 库连接到一些 samba 服务器的例子吗？我读过有类 smb.SMBConnection.SMBConnection(用户名、密码、my_name、remote_name
示例：iptables限制ssh链接服务器
linux服务器默认通过22端口用ssh协议登录，这种不安全。今天想做限制，即允许部分来源ip连接服务器。案例目标：通过iptables规则限制对linux服务器的登录。处理方法：编
Sonarqube PostProjectAnalysisTask 示例？
我一直在寻找任何 PostProjectAnalysisTask 工作代码示例，但没有看。 This页面指出 HipChat plugin使用这个钩子(Hook)，但在我看来它仍然使用遗留的 Po
GWT CustomScrollPanel 示例
我发现了 GWT 的 CustomScrollPanel 以及如何自定义滚动条，但我找不到任何示例或如何设置它。是否有任何示例显示正在使用的自定义滚动条？最佳答案这是自定义 native 滚动条的
Marionette CRUD 示例
我正在尝试开发一个 Backbone Marionette 应用程序，我需要知道如何以最佳方式执行 CRUD(创建、读取、更新和销毁)操作。我找不到任何解释这一点的资源(仅适用于 Backbone)。
Android BLE 示例
关闭。这个问题需要details or clarity .它目前不接受答案。想改进这个问题？通过 editing this post 添加详细信息并澄清问题. 去年关闭。 Improve this
将多个实例提交到数据库的表单的 Django 示例？
我需要一个提交多个单独请求的 django 表单，如果没有大量定制，我找不到如何做到这一点的示例。即，假设有一个汽车维修店使用的表格。该表格将列出商店能够进行的所有可能的维修，并且用户将选择他们想要进
spring - MultiTenantSpringLiquibase 示例。
我有一个 Multi-Tenancy 应用程序。然而，这个相同的应用程序有 liquibase。我需要在我的所有数据源中运行 liquibase，但是我不能使用这个 Bean。我的应用程序.yml
业务应用程序的 TDD 示例
我了解有关单元测试的一般思想，并已在系统中发生复杂交互的场景中使用它，但我仍然对所有这些原则结合在一起有疑问。我们被警告不要测试框架或数据库。好的 UI 设计不适合非人工测试。 MVC 框架不包括一
Clojure For Comprehension 示例
我正在使用 docjure并且它的 select-columns 函数需要一个列映射。我想获取所有列而无需手动指定。如何将以下内容生成为惰性无限向量序列 [:A :B :C :D :E ... :A
yii - findByAttributes 示例
$condition使用说明和 $param在 findByAttributes在 Yii 在大多数情况下，这就是我使用 findByAttributes 的方式 Person::model()->f
未启用 qtcreator 示例
我在 Ubuntu 11.10 上安装了 qtcreator sudo apt-get install qtcreator 安装的版本有:QT Creator 2.2.1、QT 4.7.3 当我启动

qq735679552

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

nginx日志导入elasticsearch的方法示例