gpt4 book ai didi

elasticsearch - 在Elasticsearch扫描和滚动中,是否可以控制批量大小和限制搜索中的文档数量?

转载 作者:行者123 更新时间:2023-12-02 22:32:08 25 4
gpt4 key购买 nike

使用Elasticsearch扫描和滚动功能,是否可以控制返回的批次的大小以及匹配数量的限制?

根据Elasticsearch scan-and-scroll documentation:

Although we specified a size of 1,000, we get back many more documents. When scanning, the size is applied to each shard, so you will get back a maximum of size * number_of_primary_shards documents in each batch.



这似乎表明 size参数在“扫描和滚动”中的用法不同,而在 query-then-fetch -type(它限制了匹配项的数量)中将使用不同的参数,并且没有“单独的旋钮”可以被指定。

更新

一个用例是:
  • 我有很多索引(每个索引2个)。
  • 由于某些我无法更改的良好原因,它们按天组织。
  • 有些查询就像“每天给我所有东西,不需要订单”之类,这可能会导致很多结果(成百上千)。似乎查询大小应为0(或一些非常高的数字),以允许用户最终翻阅所有内容(如果需要的话)
  • 我想快速显示结果的第一页-第一页可以显示一个可变数字,具体取决于UI设置(大约100s)。似乎我应该能够控制它并在第一个滚动ID中获取此大小。

  • 扫描滚动似乎是一个不错的选择,但是也许有更好的方法可以做到这一点?

    最佳答案

    size在扫描和滚动中的用法有所不同。它确实限制了每次滚动返回的文档数量,但是您会返回size * num_of_primary_shards

    一般而言,您是正确的,但是您可以使用限制过滤器(或2.0中的限制查询)限制返回的匹配数-似乎有些奇怪,如果以这种方式限制扫描和滚动,我将确保扫描和滚动是最佳方法期望的行为。

    关于elasticsearch - 在Elasticsearch扫描和滚动中,是否可以控制批量大小和限制搜索中的文档数量?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33707316/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com