gpt4 book ai didi

elasticsearch - 在Elasticsearch中,速度会更快-按日期过滤数据或不同索引中的索引数据

转载 作者:行者123 更新时间:2023-12-03 01:05:06 24 4
gpt4 key购买 nike

我需要索引约10亿条记录。

从elasticsearch查询数据是按月范围。 (不仅是一个月)

什么会更快?

  • 将我的文档保存在不同的索引上吗?可以说每月索引或
  • 将所有内容保存在一个索引中,因为doc字段之一将是“date”,并按此字段进行过滤?
  • 最佳答案

    如果要按月份范围进行查询,请务必按月份划分索引。
    拥有十亿个文档,您可能会需要在许多节点上放置许多分片。按日期拆分将为您提供此服务。另一种选择是使用具有大量分片的单个索引。拥有十亿个文档,根据您的文档大小和硬件,我们可能正在讨论数十个或数百个分片。

    但是,如果按日期划分,则大多数分片都可以廉价地回答0个文档与您的查询相匹配(假设您对此过滤器查询正确无误),并且有少数个分片实际上可以容纳几个月来的所有数据,因此查询。因此,这就像查询较小的索引,该索引包含查询所需的所有数据。

    关于elasticsearch - 在Elasticsearch中,速度会更快-按日期过滤数据或不同索引中的索引数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31925328/

    24 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com