gpt4 book ai didi

elasticsearch - Elasticsearch 性能相关的海量数据查询

转载 作者:行者123 更新时间:2023-12-02 23:07:28 29 4
gpt4 key购买 nike

我一直在开发一个良好的规模生产系统,在该系统中,我已索引大量数据以进行 flex 搜索。然后,我需要搜索特定的查询。这样做时,我遇到了一些与性能有关的查询。
请将此作为this的后续问题

  • 由于我过去常常使用内部命中返回嵌套数据,因此如果我们要返回大量嵌套对象,使用_source的文档不是最佳解决方案。那么我们如何克服这个问题呢?我们可以使用文档值字段吗?如果是,怎么办?
  • 请注意,默认情况下内部匹配的大小默认为3,因此我们最多可以提供100。假设我们需要返回所有结果,如何在不影响性能的情况下获取数据?
  • 最佳答案

    Reg大小,
    您可以将大小指定为大,直到不超过默认限制from + size的10K,即index module doc中指定的index.max_result_window,尽管您可以动态更改该限制,但是不建议在同一链接中提及,是更好的选择。
    更重要的是,您需要在inner_hits上定义大小,这更加昂贵,并且整个原因ES将其限制为3,而在常规查询中,默认大小限制为10。
    来到doc_values,
    无需从_source中获取值,只要您在默认情况下已启用它的字段(例如keyword字段)上使用,但对于text字段,则默认情况下未启用它,并且您必须首先启用它并且它具有以下缺点:

  • 您需要更改索引映射并重新索引所有内容
  • 它将在索引中占用更多空间。
  • 在文本字段上非常昂贵,这就是禁用它和更多信息的原因。on this official doc
  • 您已经在_source上有了此信息,由于性能原因,最好使用它。
  • 关于elasticsearch - Elasticsearch 性能相关的海量数据查询,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64172796/

    29 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com