gpt4 book ai didi

search - 如果我再次将同一文档放到ElasticSearch中,它将重新编制索引吗?

转载 作者:行者123 更新时间:2023-12-02 23:27:46 26 4
gpt4 key购买 nike

这显然是有关ES内部的问题。

我拥有的是一个基于ES的自定义搜索引擎,该引擎将来自多个供应商的数据提供给它。为了找出自上次建立索引以来特定文档是否发生了更改(例如,在定期从供应商处重新拉动文档期间-无法要求某些供应商“仅提供自该日期以来已更改的文档”),我必须检查一下对其进行某种修改,然后将其放入ES中以为更改后的文档的iff编制索引。

问:ES是否在内部跟踪文档校验和,以查看是否确实需要对其重新编制索引? (当然,我认为不是某些HTML,某些字段,时间戳等会在每个GET上动态更新)。

如果这样做的话(也就是说,对相同的文档重新编制索引的摊销成本可以忽略不计),那显然会简化我的更新。

最佳答案

如果使用Update API,则无法检测到ops https://www.elastic.co/guide/en/elasticsearch/reference/current/docs-update.html#_detecting_noop_updates。您可以在此处查看no op的源代码。 https://github.com/elastic/elasticsearch/blob/master/core/src/main/java/org/elasticsearch/action/update/UpdateRequestBuilder。请注意“额外工作”注释。绝对是要考虑的事情。

请记住,更新API的速度往往比普通的 Vanilla 散装插件慢得多。在具有相同ID的相同索引中为文档建立索引时,让ES使_version编号递增的常规插入会更快...但是它们也会创建GC和索引压力。

关于search - 如果我再次将同一文档放到ElasticSearch中,它将重新编制索引吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40744960/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com