gpt4 book ai didi

elasticsearch - 所有分片(在索引内)都具有相同的内容吗?

转载 作者:行者123 更新时间:2023-12-02 22:21:51 26 4
gpt4 key购买 nike

是否所有分片(在索引内)都具有相同的内容?

如果是,更多的分片 = 更长的传播(保存)时间?如果否,当其中一个分片失败时=合并时数据不完整?

最佳答案

首先,您需要了解什么是分片以及分片在分布式系统(如 elasticsearch)中的重要性。您可以在分片上阅读一些好的资源 here herehere .

现在回答你的问题,

Do all shards (within index) have the same content.

答案,是(假设你在这里指的是主分片,当然,副本分片只是主分片的一个副本),我们举个例子。

您的 Index 包含大约 1 亿个文档,并且您有一个 10 个数据节点集群,然后您希望水平扩展您的索引,因此您开始设置 10 个主分片和 1 个副本分片。在这种情况下,elasticsearch 会将您的数据物理划分为 10 个主分片,每个主分片将位于集群的不同节点上,因为有 10 个数据节点,类似地,每个主分片副本称为分片副本位于其主分片的不同节点上。

现在来回答您的后续问题。

If yes, more shards = longer propagation (save) time? If no, when one of shards failed = data is incomplete when merging?

由于 elasticsearch 不会在所有主分片中存储相同的数据,因此更多的分片意味着更长的传播或保存时间是无效的,而且当其中一个分片出现故障时,elasticsearch 会从其副本分片中恢复其数据因为它实际存在于不同的数据节点服务器上。

额外提示:- 分片用于拆分您的数据并使您的应用程序水平可扩展,而副本用于使您的应用程序具有高可用性,因为它包含重复的数据,因此应用程序可以轻松地从您的场景中恢复刚刚在你的后续问题中问过。

如果您需要任何说明或更多详细信息,请告诉我。

关于elasticsearch - 所有分片(在索引内)都具有相同的内容吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56619574/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com