gpt4 book ai didi

java - ElasticSearch:每次更新后创建新的倒排索引

转载 作者:塔克拉玛干 更新时间:2023-11-02 20:01:24 25 4
gpt4 key购买 nike

在我对 ElasticSearch 索引过程的理解中,我遇到了一个问题。我已经读过 this article ,也就是说,倒排索引存储所有文档的所有标记,并且它是不可变的。因此,要更新它,我们必须删除它并重新索引所有数据以使所有文档都可搜索。

但我读过有关部分更新文档的信息(自动将它们标记为“已删除”并插入+索引新文档)。但是在那些没有提到重新索引所有以前的数据的文章中。

所以,接下来我没有正确理解:当我更新文档(包含 100 000 个单词的文本文档)并且已经在存储中存储了一些其他索引文档时 - 我是否会在每个 UPDATE 或 INSERT 操作中重新索引过程我所有的文件?

基本上我依赖于默认的 ElasticSearch 设置(5 个主分片,每个分片有一个副本,集群中有 2 个节点)

最佳答案

您可以只更新一个文档(即重新索引,这基本上与从索引中删除并再次添加它相同),请参阅:http://www.elasticsearch.org/guide/en/elasticsearch/guide/current/update-doc.html这将处理整个索引,因此您不需要重新索引所有其他文档。

我不确定你所说的“保存”操作是什么意思,你可能想用一个例子来阐明它。

截至更新100K字文档所需时间,建议大家尝试一下。

关于java - ElasticSearch:每次更新后创建新的倒排索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28695846/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com