gpt4 book ai didi

elasticsearch - 在Pentaho ElasticSearch更新运行期间进行搜索

转载 作者:行者123 更新时间:2023-12-03 02:09:54 25 4
gpt4 key购买 nike

我们正在使用ES来索引数据库中约150万条记录。为了填充索引,我们使用Pentaho ES组件,该组件设置为“如果存在则覆盖”(运行约15分钟)。同样,可以通过Java服务检索,更新或删除各个索引文档。

问题是,在完整的Pentaho更新运行期间,ES将返回什么?例如,我们有150万个索引的文档,其版本=1。下一次更新会将其版本更改为2。如果在Pentaho更新文档时请求该文档–我们会收到该文档的旧版本吗?该特定文件将无法使用服务吗?另外,如果我们收到的是旧版本,新版本将在更新后立即可用还是会等到完整批次更新(pentaho组件以5k的批次发送行)?

五角镐-4.4

Elasticsearch -0.19.4

Lucene-3.6.0

最佳答案

  • 如果尚未提交新版本的文档,则将收到该文档的旧版本。该服务将继续可用。
  • 新版本将可用,具体取决于Elasticsearch中的refresh_interval设置。默认为每个1s

  • pentaho可能在数据加载期间扭曲了 refresh_interval。如果是这种情况,那么您必须等待,直到pentaho直接调用 refresh方法或重置参数为止。

    您可以简单地开始运行,然后通过以下方法检查 refresh_interval的设置:
    curl -XGET "http://my-es-server:9200/my-index-name/_settings"

    关于elasticsearch - 在Pentaho ElasticSearch更新运行期间进行搜索,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15256989/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com