Elasticsearch /Kibana : get values that are not found in entries more recent than a certain date-6ren

Elasticsearch /Kibana : get values that are not found in entries more recent than a certain date

转载作者：行者123 更新时间：2023-12-02 23:10:21

我有一组设备定期(比如说每 10 分钟)推送到 ElasticSearch，这种形式的条目:

{
    "deviceId": "unique-device-id",
    "timestamp": 1586390031,
    "payload" : { various data }
}

我通常通过 Kibana 过滤过去 7 天的数据，然后通过设备 ID 或来自有效负载的其他一些数据向下钻取。

现在我试图通过查找在过去一小时内没有报告任何内容的设备来了解这支舰队的健康状况。我一直在搞乱各种过滤器和可视化，最接近这个的是一个数据表，其中包含设备 ID 和每个条目的最后一个条目的时间戳，按时间戳排序。这很有用，但有点难以使用，因为我有几千台设备。

我的梦想是让上述表格仅包含过去一小时内未报告的设备 ID，或仅获得两个数字:过去 7 天看到的不同设备 ID 的总数和过去一小时内未看到的设备 ID。

如果其中任何一个是可能的，你能指出我正确的方向吗？

最佳答案

我将跳过表格并采用第二种方法——只计算计数。我认为有可能从计数倒退到行。

注意:我将使用人类可读的时间格式而不是时间戳，但 epoch_seconds在您的实际用例中也可以正常工作。另外，我添加了 comment字段为每个文档提供一些背景。

首先，设置您的索引:

PUT fleet
{
  "mappings": {
    "properties": {
      "timestamp": {
        "type": "date",
        "format": "epoch_second||yyyy-MM-dd HH:mm:ss"
      },
      "comment": {
        "type": "text"
      },
      "deviceId": {
        "type": "text",
        "fields": {
          "keyword": {
            "type": "keyword"
          }
        }
      }
    }
  }
}

同步一些文档——我在 UTC+2，所以我选择了这些时间戳:

POST fleet/_doc
{
  "deviceId": "asdjhfa343",
  "timestamp": "2020-04-05 10:00:00",
  "comment": "in the last week"
}

POST fleet/_doc
{
  "deviceId": "asdjhfa343",
  "timestamp": "2020-04-10 13:05:00",
  "comment": "#asdjhfa343 in the last hour"
}

POST fleet/_doc
{
  "deviceId": "asdjhfa343",
  "timestamp": "2020-04-10 12:05:00",
  "comment": "#asdjhfa343 in the 2 hours"
}

POST fleet/_doc
{
  "deviceId": "asdjhfa343sdas",
  "timestamp": "2020-04-07 09:00:00",
  "comment": "in the last week"
}

POST fleet/_doc
{
  "deviceId": "asdjhfa343sdas",
  "timestamp": "2020-04-10 12:35:00",
  "comment": "in last 2hrs"
}

总的来说，我们有 5 个文档和 2 个不同的设备 ID，具有以下条件

都出现在最后 7d

两者都在最后 2 小时和

最后一小时只有一个

所以我有兴趣准确地找到 1 deviceId其中 在过去 2 小时内出现，但在 1 小时内未出现 .

使用 filter 的组合(用于范围过滤器)， cardinality (用于不同计数)和 bucket script (用于计数差异)聚合。

GET fleet/_search
{
  "size": 0,
  "aggs": {
    "distinct_devices_last7d": {
      "filter": {
        "range": {
          "timestamp": {
            "gte": "now-7d"
          }
        }
      },
      "aggs": {
        "uniq_device_count": {
          "cardinality": {
            "field": "deviceId.keyword"
          }
        }
      }
    },
    "not_seen_last1h": {
      "filter": {
        "range": {
          "timestamp": {
            "gte": "now-2h"
          }
        }
      },
      "aggs": {
        "device_ids_per_hour": {
          "date_histogram": {
            "field": "timestamp",
            "calendar_interval": "day",
            "format": "'disregard' -- yyyy-MM-dd"
          },
          "aggs": {
            "total_uniq_count": {
              "cardinality": {
                "field": "deviceId.keyword"
              }
            },
            "in_last_hour": {
              "filter": {
                "range": {
                  "timestamp": {
                    "gte": "now-1h"
                  }
                }
              },
              "aggs": {
                "uniq_count": {
                  "cardinality": {
                    "field": "deviceId.keyword"
                  }
                }
              }
            },
            "uniq_difference": {
              "bucket_script": {
                "buckets_path": {
                  "in_last_1h": "in_last_hour>uniq_count",
                  "in_last2h": "total_uniq_count"
                },
                "script": "params.in_last2h - params.in_last_1h"
              }
            }
          }
        }
      }
    }
  }
}

date_histogram聚合只是一个占位符，使我们能够使用 bucket script获得最终差异，无需进行任何后期处理。

由于我们通过了 size: 0 ，我们对 hits 不感兴趣部分。所以只取聚合，这里是带注释的结果:

...
"aggregations" : {
    "not_seen_last1h" : {
      "doc_count" : 3,
      "device_ids_per_hour" : {
        "buckets" : [
          {
            "key_as_string" : "disregard -- 2020-04-10",
            "key" : 1586476800000,
            "doc_count" : 3,            <-- 3 device messages in the last 2hrs
            "total_uniq_count" : {
              "value" : 2               <-- 2 distinct IDs
            },
            "in_last_hour" : {
              "doc_count" : 1,
              "uniq_count" : {
                "value" : 1             <-- 1 distict ID in the last hour
              }
            },
            "uniq_difference" : {
              "value" : 1.0             <-- 1 == final result !
            }
          }
        ]
      }
    },
    "distinct_devices_last7d" : {
      "meta" : { },
      "doc_count" : 5,                  <-- 5 device messages in the last 7d
      "uniq_device_count" : {
        "value" : 2                     <-- 2 unique IDs
      }
    }
  }

关于 Elasticsearch /Kibana : get values that are not found in entries more recent than a certain date，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/61112108/

文章推荐： javascript - Highcharts，使 y 轴从零开始

文章推荐： cassandra - Spark-streaming:如何将流数据输出到cassandra

文章推荐： powershell - 删除大量文件而不会耗尽内存

python - 需要正则表达式帮助 : Match if certain string doesn't start with certain sub-patterns AND certain character should not be there
我需要为一个小项目想出一个正则表达式。字符串不应以: "/wiki" 而且它也不应该有下面的模式"/.*:.*"(基本上模式以字符 '/' 开头，之后出现任何 ':') 而且它也不能有某个字符'#'
javascript - react : Render certain element based on certain button click
嗨，我有一个 react 应用程序，我正在返回几个按钮。我想做的是根据您单击的按钮，另一个组件将在 View 中显示和渲染。我已经查看了文档中的条件渲染，但我不确定如何将其与状态联系起来并渲染我所期望
JavaScript if 语句 : apply when a certain value changes to another certain value
如何编写 if 语句，使其仅在选择框中的值 A 更改为值 B 时应用？ https://jsfiddle.net/mademoiselletse/gv0ohdzv/1/ 我有以下“英里”选择框和“剩余
php - 正则表达式 : match a word of certain length which starts with certain letters
我需要一个匹配 7 字母单词的正则表达式，该单词以 'st' 开头。例如，它应该只匹配以下内容中的 'startin':start startin starting 最佳答案一般提示: 起始符号直接
php - Instagram API : Get posts from a certain user that also has a certain hashtag
我知道这两个端点:/users/{user-id}/media/recent和/tags/{tag-name}/media/recent 但我试图只获取某个用户发布的也有某个主题标签的帖子。有没有简单
c# - When a certain item on dropdownlist1 is selected, select automatically a certain item on dropdownlist2
我想当在下拉列表 1 上选择项目 x5 时，在下拉列表 2 上自动选择项目 y0 x5 x4
apache-kafka - 单个主题内的 Kafka 安全性 : allowing only certain users to read certain messages,
我有一个要求，我们将把一堆不同供应商的金融价格“firehosing”到 Kafka 中的一个“市场数据”主题中。问题是，其中一些供应商具有细粒度的许可要求，一直到单个证券。如果不为每个不同的许可粒度
machine-learning - 神经网络: constraint certain input nodes contribution to certain output nodes
我想使用神经网络来学习输入向量和输出向量的映射。该问题的物理原理有限制，某些输入节点仅对某些输出节点有影响。我想在训练中使用这个约束。如果我将神经网络表述为有向图，我想象从某些输入节点到输出节点的路
Javascript - 如何检查 "certain"复选框而不是全部使用我当前的代码？
所以我在一页上弹出了两个表格。这是我之前用来选择第一个表中的所有复选框(当时是唯一一个)的脚本: $('#selectAll').click(function() { if(this.ch
ios - 是否可以让应用程序在照片中查找 "certain features"
关闭。这个问题需要更多focused .它目前不接受答案。想改进这个问题吗？更新问题，使其只关注一个问题 editing this post . 关闭 8 年前。 Improve this q
css - 使用 :after only on certain divs
我正在尝试显示 | 管道字符以分隔我页面上的链接。但问题是它们都有相同的类，如果我将它应用于类，它们都会得到管道，这很好，除了最后一个。我能够抵消这种情况的唯一方法是将我需要的那些应用到一个 id，除
windows - 删除包含 "certain"个单词的文件
所以我有一个包含大约 300 个 .txt 文件的文件夹，所有文件的命名如下 ERROR WITH Position Post_20162602_052055.txt ERROR WITH Posit
C: Bitwise NOT on certain bit
我的问题很简单，但我找不到简单的解决方案:我有一个大于或等于 16 的整数，所以至少 1000 是二进制的。我希望使用按位非运算符翻转第三位。在这种情况下，它将是 1100。有没有运营商可以做到这一
Scala 宏 : Checking for a certain annotation
感谢对 my previous question 的回答，我能够创建一个函数宏，使其返回 Map将每个字段名称映射到它的类值，例如 ... trait Model case class User (n
iphone - viewDidAppear : not firing under certain conditions?
我的应用程序 Nib 中有以下项目: 通常:文件所有者、第一响应者窗口、委托(delegate) View Controller “a” 查看“b” UIScrollView“c” “b”中的一些其他
Angular 变化检测: how to refresh only certain items?
假设我的屏幕上有 100 个由 *ngFor 生成的 div，它们从具有类似数据的对象中获取值 {A1:someOtherObject，A2:someOtherOtherObject...，J10:s
c# - 抽象类和虚方法: cannot access certain variables
我正在使用抽象类和虚拟方法。目前，我有一个由按钮单击和两个多行文本框组成的窗口窗体，我在其中显示结果。基类有一个默认构造函数和一个接受基类所需的所有必要数据的构造函数。有两个类 Trees 和 Tom
R回归分析: analyzing data for a certain ethnicity
我有一个数据集可以调查不同种族(黑人、白人和拉丁裔)个体的抑郁症。我想知道基线时的抑郁症与所有种族的后期抑郁症有何关系，我做到了 lm(depression_base ~ depression_po
Lucene 索引 : Exclude certain terms
如何根据长度排除某些术语？例如，不要将少于 3 个字母或多于 20 个字母的术语编入索引。还排除以数字开头的单词。谢谢，最佳答案 StandardAnalyzer 有一个您可以设置的 maxTok
jquery - : How to highlight certain words with jQuery
我正在寻找一个脚本，可以根据单词的位置突出显示一定数量的单词。例如，对于以下内容我只想突出显示第二个、第三个和第四个单词: Quisque bibendum sem ut lacus. In

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

Elasticsearch /Kibana : get values that are not found in entries more recent than a certain date