elasticsearch - Elasticsearch术语聚合会跳过一些条目-6ren

elasticsearch - Elasticsearch术语聚合会跳过一些条目

转载作者：行者123 更新时间：2023-12-02 23:23:25

25

4

我们使用elasticsearch收集SQL统计信息。
一旦我们注意到某些条目未出现在聚合中。

这是一个示例请求(最初由kibana生成):

POST /_msearch 
{"index":["stat-2017-09-04"],"ignore_unavailable":true,"preference":1504514752086}
{
   "query":{
      "bool":{
         "must":[
            {
               "query_string":{
                  "analyze_wildcard":true,
                  "query":"Group:spbpro.db.sql AND AppUserName:robot"
               }
            },
            {
               "range":{
                  "EndTime":{
                     "gte":1504503690000,
                     "lte":1504503692800,
                     "format":"epoch_millis"
                  }
               }
            }
         ],
         "must_not":[

         ]
      }
   },
   "aggs":{
      "3":{
         "terms":{
            "field":"Name.keyword",
            "size":5000,
            "order":{
               "1":"desc"
            }
         },
         "aggs":{
            "1":{
               "sum":{
                  "field":"TotalTime"
               }
            },
            "2":{
               "date_histogram":{
                  "field":"EndTime",
                  "interval":"20ms",
                  "time_zone":"Asia/Baghdad",
                  "min_doc_count":1
               },
               "aggs":{
                  "1":{
                     "sum":{
                        "field":"TotalTime"
                     }
                  }
               }
            }
         }
      }
   }
}

这是elasticsearch的答案:

{
    "responses": [
    {
        "took": 1,
        "timed_out": false,
        "_shards": {
        "total": 5,
        "successful": 5,
        "failed": 0
      },
      "hits": {
        "total": 2,
        "max_score": 4.754195,
        "hits": [
          {
            "_index": "stat-2017-09-04",
            "_type": "stat-spbpro.db.sql",
            "_id": "AV5LaI15AUHnqGLtN2GS",
            "_score": 4.754195,
            "_source": {
              "Group": "spbpro.db.sql",
              "Name": "select * from (select a.IDPU, sum(d.COUNT)as CNT     from (         select IDPU, max(ID) as ID             from (select IDPU, ID from PARAMS where             IDTPPARAM in (select ID from TPPARAMS where IDTPARC=?))             where             ID in (select IDPARAM from DATA_1064_A where DTPU>=? and DTPU<=?)             group by IDPU         ) a     join DATA_1064_A d on d.IDPARAM=a.ID and DTPU>=? and DTPU<=?     group by IDPU) where IDPU in (select ID from TEMP_IDS where IDTYPE=1)",
              "StartTime": "2017-09-04T05:36:09.0559048Z",
              "EndTime": "2017-09-04T05:41:31.7295827Z",
              "TotalTime": 297761.8962,
              "Count": 13
            }
          },
          {
            "_index": "stat-2017-09-04",
            "_type": "stat-spbpro.db.sql",
            "_id": "AV5LaI15AUHnqGLtN2OF",
            "_score": 4.7034826,
            "_source": {
              "Group": "spbpro.db.sql",
              "Name": "select IDPU, count(*) as HRSCNT from PUTEDATAS where DTFR>=? and DTFR<? and IDPU in (select ID from TEMP_IDS where IDTYPE=1) group by IDPU",
              "StartTime": "2017-09-04T05:37:06.2981554Z",
              "EndTime": "2017-09-04T05:41:32.7463729Z",
              "TotalTime": 4277.6874,
              "Count": 13
            }
          }
        ]
      },
      "aggregations": {
        "3": {
          "doc_count_error_upper_bound": 0,
          "sum_other_doc_count": 0,
          "buckets": [
            {
              "1": {
                "value": 4277
              },
              "2": {
                "buckets": [
                  {
                    "1": {
                      "value": 4277
                    },
                    "key_as_string": "2017-09-04T08:41:32.740+03:00",
                    "key": 1504503692740,
                    "doc_count": 1
                  }
                ]
              },
              "key": "select IDPU, count(*) as HRSCNT from PUTEDATAS where DTFR>=? and DTFR<? and IDPU in (select ID from TEMP_IDS where IDTYPE=1) group by IDPU",
              "doc_count": 1
            }
          ]
        }
      },
      "status": 200
    }
  ]
}

聚合中包含“选择IDPU，count(*)作为HRSCNT ...”的存储桶。那是正确的。

但是，为什么“select * from(select a.IDPU ...)仅在匹配中列出而没有出现在聚合中？

Elasticsearch版本是5.0

最佳答案

我认为您的映射可能看起来像这样:

... "Name": { "type" "text", "fields": { "keyword": { "type": "keyword", "ignore_above": 256 } } } ...

当您未显式设置映射时，这是字符串的默认映射。意思是，在 keyword字段中不会索引长度超过256个字符的字符串(并且不会在聚合中显示)。参见 ignore_above docs。源仍然被存储，因此您可以在搜索结果中看到它们，并且可以搜索分析的字段( Name)。

您可以通过显式创建映射并省略 ignore_above来解决此问题。您必须将数据重新索引为新索引(您不能更改现有映射)-您可以使用 reindex api轻松完成此操作。如果您只想搜索此字段作为关键字(并且您不希望分析字段)，则也可以仅使用一个 keyword字段，如下所示:

... "Name": { "type" "keyword" } } ...

关于elasticsearch - Elasticsearch术语聚合会跳过一些条目，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/46049836/

25

4

0

文章推荐： Cassandra 主键允许重复

文章推荐： excel - VBA:方法中括号的使用

文章推荐： audio - 通过UDP在wifi网络中流音频

ios - 如何导航回已删除的 PageViewController 条目/更改 PageViewController 条目
情况:我想从数据条目列表导航回我的 PageViewController。 before 和 previous 函数起作用 func pageViewController(pageViewContro
java - 如何避免 Gradle 的 osgi 插件为私有(private)包生成 export-pacakge 条目，为嵌入式依赖项生成 import-package 条目
尊敬的 StackOverflow 用户我有一个 gradle 项目，我想将其工件转换为 osgi 包。在这个包中，我有: 我不想导出的包(可能不会出现在 list 的 Export-Package
android - AlarmManager 条目
我为我的 PendingIntent 设置了一个警报。现在我想在我的 Activity 中显示是否设置了此警报。 Intent service = new Intent(context, MyServ
一个表中最常出现在另一表中的 MYSQL 条目
我有 2 个表、作者和书籍 authors 包含唯一的 IDauthorId 书籍也包含此作为外键我需要知道书籍数量最多的作者。如果 2 个或更多作者并列最多书籍，我需要显示这两位作者我已经能够通
mysql - 根据重复的列值删除行/条目
我有一个名为 prospective_shop 的表，其中一个列名称是“用户名”。用户名未设置为主键，但我想删除所有具有重复用户名的行。我怎样才能以最快的方式做到这一点？我尝试执行以下操作: ALT
android - 如何阅读添加到日历的事件/条目？
我现在可以添加条目了。在我的应用程序中，用户可以在他的日历上输入约会/事件。但在他这样做之前，它应该向他显示他已经添加的事件。它应该从日历中获取事件并将其显示给他。这该怎么做？我被困在这部分。提前致谢
在内核中创建一个简单的只写 proc 条目
#include #include #include #include #include #include char *msg; ssize_t write_proc(struct file
从内核模块创建 sysfs 条目
我想将大于 1024 个字符的字符串传递到我的模块(文件系统)。由于内核参数限制为 1024 个字符，someone recommended改为使用 sysfs。我试图包括 this example
python - SQLAlchemy:相关子查询中仍然存在 FROM 条目
我正在尝试使用 SQLAlchemy 构建以下查询(用作包含查询的子查询，该查询定义名为 tbl_outer 的别名): SELECT max(tbl.ts) AS max_1 FROM tbl WH
Java - 仅比较特定键的两个 Maps 条目
假设我有两张 map : Map map1 = Map.of( "a", "1", "b", "2", "c", "3", "x
VBA:从每个类别中提取前 'x' 条目
通过简化示例，假设您有以下数据集: A B C Name Group Amount Dave A 2 Mike B 3 Adam C 4
apache - 三级域的 DNS 条目
我正在尝试在我的服务器上创建一个三级域虚拟主机。我希望配置设置正确，但我得到一个 ERR_NAME_NOT_RESOLVED错误。我已经读到我必须在某处“添加 DNS 条目”以便解析名称，但我该怎么
regex - 我可以使用什么正则表达式来查找逗号分隔列表中的 Nᵗʰ 条目？
我需要一个可用于在逗号分隔列表中查找第 N 个条目的正则表达式。例如，假设此列表如下所示: abc,def,4322,mail@mailinator.com,3321,alpha-beta,43 .
GWT .hgignore/.gitignore 条目
GWT 应用程序(在 Eclipse 中开发)的源代码管理忽略文件中的典型条目是什么？最佳答案我会推荐: 你leave the eclipse files (.project, .classpat
sql - 需要帮助为没有订单的月份生成 NULL 条目
我必须创建显示表 (Tbl) 中所有字段的输出，并创建一个额外的列来按月计算每个客户的累计总和(例如，如果客户在 4 月份有两次销售，新列将具有这些销售额和两行中任何先前销售额的总和)。我能做的就这么
docker - 使用从属性文件创建的 ConfigMap 条目
文档 ( http://kubernetes.io/docs/user-guide/configmap/ ) 上用于使用值的示例基于 ConfigMap，其中每个数据条目都是一对/值。例子: apiV
autohotkey - 创建以冒号结尾的 AutoHotkey 条目
我有一个奇怪的错字，我一遍又一遍地犯，而不是实际工作我的打字技巧，我想编辑我的 AutoHotkey 脚本来弥补这一点。有时，当我输入大写字母时，我会点击:按钮并输入“I:”，我希望 AHK 仅用字
x86 - 初始加载后如何更新 GDT 条目？
使用 lgdt 初始化 GDT 并将其加载到 GDTR 后，稍后如何更新 GDT？如果我使用 sgdt 命令获取基地址，然后更新或添加条目，然后使用 lgdt 再次重新加载，我是否正确？还有其他方法
c# - 条目(数据库)已添加
我有两个应用程序共享同一个数据库，即 API 和 MVC5 应用程序。两者都在本地主机上运行良好，但在部署到我的 Azure 帐户时出现此错误 Configuration Error Descrip
powershell - 从数组中删除 'lesser' 条目
我正在尝试修剪我拥有的一些文件。我将为您保存到目前为止我编写的野兽，并通过提供虚构代码使其保持简单。让我们来看看这个数组: [System.String[]]$Collection = 'Invit

首页

博学

6Ren·AI

商城

elasticsearch - Elasticsearch术语聚合会跳过一些条目