amazon-web-services - ElasticSearch 节点故障-6ren

amazon-web-services - ElasticSearch 节点故障

转载作者：行者123 更新时间：2023-12-02 23:49:19

24

4

我的 Elasticsearch 集群从 2B 文档减少到 900M 记录，在 AWS 上显示

Relocating shards: 4

显示时

Active Shards: 35

和

Active primary shards: 34

(可能不相关，但这是其余的统计数据):

Number of nodes: 9

Number of data nodes: 6

Unassigned shards: 17

运行时

GET /_cluster/allocation/explain

它返回:

{
  "index": "datauwu",
  "shard": 6,
  "primary": true,
  "current_state": "unassigned",
  "unassigned_info": {
    "reason": "NODE_LEFT",
    "at": "2019-10-31T17:02:11.258Z",
    "details": "node_left[removedforsecuritybecimparanoid1]",
    "last_allocation_status": "no_valid_shard_copy"
  },
  "can_allocate": "no_valid_shard_copy",
  "allocate_explanation": "cannot allocate because a previous copy of the primary shard existed but can no longer be found on the nodes in the cluster",
  "node_allocation_decisions": [
    {
      "node_id": "removedforsecuritybecimparanoid2",
      "node_name": "removedforsecuritybecimparanoid2",
      "node_decision": "no",
      "store": {
        "found": false
      }
    },
    {
      "node_id": "removedforsecuritybecimparanoid3",
      "node_name": "removedforsecuritybecimparanoid3",
      "node_decision": "no",
      "store": {
        "found": false
      }
    },
    {
      "node_id": "removedforsecuritybecimparanoid4",
      "node_name": "removedforsecuritybecimparanoid4",
      "node_decision": "no",
      "store": {
        "found": false
      }
    },
    {
      "node_id": "removedforsecuritybecimparanoid5",
      "node_name": "removedforsecuritybecimparanoid5",
      "node_decision": "no",
      "store": {
        "found": false
      }
    },
    {
      "node_id": "removedforsecuritybecimparanoid6",
      "node_name": "removedforsecuritybecimparanoid6",
      "node_decision": "no",
      "store": {
        "found": false
      }
    },
    {
      "node_id": "removedforsecuritybecimparanoid7",
      "node_name": "removedforsecuritybecimparanoid7",
      "node_decision": "no",
      "store": {
        "found": false
      }
    }
  ]
}

我对这到底意味着什么有点困惑，这是否意味着我的 Elasticsearch 集群没有丢失数据，而是将其重新定位到不同的分片中，或者它找不到分片？
如果它找不到分片，这是否意味着我的数据丢失了？如果是这样，可能是什么原因，我怎样才能防止将来发生这种情况？
我在索引数据时没有设置副本，并且在索引时副本会减慢它的速度。
也不是，我的记录数一度下降到 400m，然后随机上升到 900m。我不知道这意味着什么，任何见解将不胜感激。

最佳答案

"reason": "NODE_LEFT"

和:

I haven't setup replicas as i was indexing data, and replicas slow it down whilst indexing.

如果持有主分片的节点已经消失，那么是的，您的数据也消失了。毕竟，如果没有副本，那么如果主(也是唯一的)分片不再是集群的一部分，集群将从哪里检索数据？您要么需要将保存这些分片的节点重新启动并将其添加到集群中，要么数据就会消失。

错误消息是“您希望我为这个我知道存在的索引分配一个主分片，但曾经有另一个版本的主分片无法找到，我不会再分配它以防万一之前的小学回来了。”

您可以通过使用 allocate_stale_primary 执行重新路由来强制 Elasticsearch 重新分配主分片(并明确接受前一个主分片中的数据已消失)。 ( doc ):

curl -XPOST '127.0.0.1:9200/_cluster/reroute?pretty' -d '{
    "commands" : [ {
        "allocate_stale_primary" :
            {
              "index" : "datauwu", "shard" : 6,
              "node" : "target-data-node-id",
              "accept_data_loss" : true
            }
        }
    ]
}'

除了使用一次性数据进行开发之外，关闭副本通常是一个坏主意。

also side not, my record count dropped down to 400m at one point but then rose back up to 900m randomly. i don't know what this means and any insight would greatly be appreciated.

发生这种情况是因为分片在集群中不可见。如果正在分配、重新定位或恢复分片的所有副本，就会发生这种情况。这对应于 RED 集群状态。您可以通过确保至少有 1 个副本来缓解它(尽管理想情况下您设置了足够数量的副本，以便在集群中丢失 N 个数据节点后继续存在)。这让 Elasticsearch 将一个分片保留为主分片，同时移动其他分片。

如果您只有主节点而没有副本节点，那么如果主节点正在恢复或重定位，则该分片中的数据在集群中将不可见。一旦分片再次处于事件状态，其中的文档就会变得可见。

关于amazon-web-services - ElasticSearch 节点故障，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/58758088/

24

4

0

文章推荐： Javascript - 从末尾开始移动的子字符串

文章推荐： SonarQube:限定认知复杂性

文章推荐： javascript - d3js 在多个图表之间切换

文章推荐： javascript - 将 Grunt 放入子目录中

JavaFX - 每行迭代 GridPane 节点 - 每行读取 GridPane 节点
我正在使用 JavaFX 8 创建一个应用程序。我使用拖/放动态更改网格 Pane 的内容。我希望每行或每行/列迭代 GridPane 内容。JavaFX 允许通过指定行和列在 GridPane 中添
javascript - 错误:无法在“节点”上执行“appendChild”:参数1不是“节点”类型
我正在尝试将图像拖放到div上。图像没有被拖到div上并给出以下错误 Uncaught TypeError: Failed to execute 'appendChild' on 'Node': pa
java - 如何在 ARcore 的帮助下相对于一个 anchor 定位 anchor /节点/ anchor 节点？
我正在 android studio 中创建内部构建 AR 导航。我正在寻找一种方法将 anchor 与其他 anchor 或 anchor 节点/节点“连接”起来。我不确定使用哪一个。基于我将强制用
hadoop - 我的 2 节点 hadoop 比我的 4 节点 hadoop 表现更好
我在 Hive 上运行一些作业:首先是 4 节点，然后是 2 节点。令我惊讶的是，我的 2 节点性能比我的 4 节点更好。首先，我在一个 4 节点(4 个事件节点)上运行查询，然后关闭 2 个节点(
c++ - ' =' : cannot convert from ' CircularDoubleDirectedList::节点 *' to ' 节点 *'
我有 Node* current ，我在其中存储指向列表“顶部”当前节点的指针。当我将一个新节点设置为当前节点时，出现错误: '=' : cannot convert from 'CircularDo
linux - 无法使用 dcos 节点 ssh --master-proxy --leader sshing 进入 dcos 节点
我是 dcos Mesos 的新手，在本地 Ubuntu 机器上安装了 dc os。我可以查看 dcos 仪表板。但我无法使用 dcos node ssh --master-proxy --lea
JavaFX:如何定位组件/节点？
在 JavaFX 中，是否有类似 setLayout(); 的东西？或 setBounds(); ? 例如，我想将按钮定位到我想要的位置。最佳答案 JavaFX 场景图上的所有内容都是 Node .
JavaFX 节点 - 如何让最终用户调整它们的大小？
我正在开发一个 JavaFX 应用程序，其中我开发的类(从 javafx.scene.Parent 扩展)是根据用户在 ListView 控件中单击的条目动态创建的。只是要清楚这个节点，它不是使用像
uml - 节点-边缘关系的类图
我正在尝试为节点-边缘关系创建一个类图，因为它可以在有向图中找到。我想传达的是，Nodes 引用了 Edges，Edges 也引用了 Nodes。每个 Edge 都恰好需要两个 Node(源和目标)。
hadoop - 如何指定应在其上运行mapreduce的各个tasktrackers(节点)？
在mapreduce作业期间，单个任务将在随机节点上运行，是否有任何方法限制应在其中运行任务的节点？最佳答案 Hadoop不会选择节点来随机运行任务。考虑到数据局部性，否则将有很多网络开销。任务与
Cassandra 节点 - 重建与重建维修
有什么区别: a) nodetool 重建 b) nodetool 修复 [-pr] 换句话来说，各个命令到底是做什么的？最佳答案 nodetool重建:类似于引导过程(当您向集群添加新节点时)，但
java - 节点 : 没有数据类型
我已将第一个 OneToMany 关系添加到我的 hibernate 3.6.10 项目中。这是一个类: /** * */ package com.heavyweightsoftware.leal
javascript - 获取触发事件的元素(节点)
是否有可能找到正在监听触发当前函数的事件的元素？在下面的代码中，event.target 返回 #xScrollPane 和 event.currentTarget 和 event 的最低子节点.f
javascript - 覆盖数据而不生成新的键/节点
我正在尝试覆盖我数据库中的一些数据。结构很简单，就是: recipes { user_1{ recipe_1{data} recipe_2{data} } user_2{
javascript - 输入后运行JS函数，节点
我使用 setInterval 来运行该函数，但它会多次执行函数 2... 如何在输入中插入一个值后执行函数第一个输入与其余输入的距离不同如何在插入 val(tab 选项)后将插入从 1 个输入移
c++ - “节点”不是全局命名空间的成员？
我不知道代码有什么问题，但在 visual studio 中不断收到这些错误消息。 Error 18 error C1903: unable to recover from previous e
JavaScript/jQuery 节点
我正在尝试从其类中获取 SharePoint 搜索导航节点的对象。 var nodes = $("div.ms-qSuggest-listItem"); 我正在获取节点对象，现在想要获取“_promp
javascript - 节点|运行JS文件时出错
D:\nodeP>node main.js module.js:327 抛出错误； ^ 错误:在 Function.Module 的 Function.Module._resolveFilename
c++ - 节点(){}是什么意思？
struct node{ int key, prior, cnt, val; node *l, *r; node(){} node(int nkey) : key(nkey),
c++ - 如何删除正在使用的对象(节点)
我有以下代码使用迭代器将项目插入双链表。这就是我们被要求这样做的方式。代码有效，但问题是我有 24 字节的绝对内存泄漏。 NodeIterator insert(NodeIterator & itrP

首页

博学

6Ren·AI

商城

amazon-web-services - ElasticSearch 节点故障