elasticsearch - 为什么分片在批量插入期间被初始化和重新定位-6ren

elasticsearch - 为什么分片在批量插入期间被初始化和重新定位

转载作者：行者123 更新时间：2023-12-04 06:31:31

我正在尝试将数据批量插入到具有 3 个数据节点的 4 节点 Elasticsearch 集群中。

数据节点规范:16 个 CPU - 7GB 内存 - 500GB SSD

数据被插入到非数据节点上并拆分成 5 个分片并设置为具有 1 个副本。大约有 250GB 的数据要插入。

然而，在每个节点上插入约 40GB 的数据并处理一小时后，同时在整个时间跨度内最大使用 CPU 约 60% 和 RAM 约 30% 后，一些分片进入初始化状态:

~$ curl -XGET 'http://localhost:9200/_cluster/health/osm?level=shards&pretty=true'
{
  "cluster_name" : "elastic_osm",
  "status" : "yellow",
  "timed_out" : false,
  "number_of_nodes" : 4,
  "number_of_data_nodes" : 3,
  "active_primary_shards" : 5,
  "active_shards" : 9,
  "relocating_shards" : 1,
  "initializing_shards" : 1,
  "unassigned_shards" : 0,
  "delayed_unassigned_shards" : 0,
  "number_of_pending_tasks" : 0,
  "number_of_in_flight_fetch" : 0,
  "indices" : {
    "osm" : {
      "status" : "yellow",
      "number_of_shards" : 5,
      "number_of_replicas" : 1,
      "active_primary_shards" : 5,
      "active_shards" : 9,
      "relocating_shards" : 1,
      "initializing_shards" : 1,
      "unassigned_shards" : 0,
      "shards" : {
        "0" : {
          "status" : "yellow",
          "primary_active" : true,
          "active_shards" : 1,
          "relocating_shards" : 0,
          "initializing_shards" : 1,
          "unassigned_shards" : 0
        },
        "1" : {
          "status" : "green",
          "primary_active" : true,
          "active_shards" : 2,
          "relocating_shards" : 0,
          "initializing_shards" : 0,
          "unassigned_shards" : 0
        },
        "2" : {
          "status" : "green",
          "primary_active" : true,
          "active_shards" : 2,
          "relocating_shards" : 1,
          "initializing_shards" : 0,
          "unassigned_shards" : 0
        },
        "3" : {
          "status" : "green",
          "primary_active" : true,
          "active_shards" : 2,
          "relocating_shards" : 0,
          "initializing_shards" : 0,
          "unassigned_shards" : 0
        },
        "4" : {
          "status" : "green",
          "primary_active" : true,
          "active_shards" : 2,
          "relocating_shards" : 0,
          "initializing_shards" : 0,
          "unassigned_shards" : 0
        }
      }
    }
  }
}

再深入一点，我发现有一个节点的堆空间有问题:

~$ curl -XGET 'localhost:9200/osm/_search_shards?pretty=true'
{
  "nodes" : {
    "1DpvDUf7SKywJrBgQqs9eg" : {
      "name" : "elastic-osm-node-1",
      "transport_address" : "inet[/xxx.xxx.x.x:xxxx]",
      "attributes" : {
        "master" : "true"
      }
    },
    "FiBYw-v_QfO3nJQfHflf_w" : {
      "name" : "elastic-osm-node-3",
      "transport_address" : "inet[/xxx.xxx.x.x:x]",
      "attributes" : {
        "master" : "true"
      }
    },
    "ibpt8lGiS6yDJf4e09RN9Q" : {
      "name" : "elastic-osm-node-2",
      "transport_address" : "inet[/xxx.xxx.x.x:xxxx]",
      "attributes" : {
        "master" : "true"
      }
    }
  },
  "shards" : [ [ {
    "state" : "STARTED",
    "primary" : true,
    "node" : "ibpt8lGiS6yDJf4e09RN9Q",
    "relocating_node" : null,
    "shard" : 0,
    "index" : "osm"
  }, {
    "state" : "INITIALIZING",
    "primary" : false,
    "node" : "FiBYw-v_QfO3nJQfHflf_w",
    "relocating_node" : null,
    "shard" : 0,
    "index" : "osm",
    "unassigned_info" : {
      "reason" : "ALLOCATION_FAILED",
      "at" : "2015-10-30T10:42:25.539Z",
      "details" : "shard failure [engine failure, reason [already closed by tragic event]][OutOfMemoryError[Java heap space]]"
    }
  } ], [ {
    "state" : "STARTED",
    "primary" : true,
    "node" : "FiBYw-v_QfO3nJQfHflf_w",
    "relocating_node" : null,
    "shard" : 1,
    "index" : "osm"
  }, {
    "state" : "STARTED",
    "primary" : false,
    "node" : "1DpvDUf7SKywJrBgQqs9eg",
    "relocating_node" : null,
    "shard" : 1,
    "index" : "osm"
  } ], [ {
    "state" : "RELOCATING",
    "primary" : false,
    "node" : "FiBYw-v_QfO3nJQfHflf_w",
    "relocating_node" : "1DpvDUf7SKywJrBgQqs9eg",
    "shard" : 2,
    "index" : "osm"
  }, {
    "state" : "STARTED",
    "primary" : true,
    "node" : "ibpt8lGiS6yDJf4e09RN9Q",
    "relocating_node" : null,
    "shard" : 2,
    "index" : "osm"
  }, {
    "state" : "INITIALIZING",
    "primary" : false,
    "node" : "1DpvDUf7SKywJrBgQqs9eg",
    "relocating_node" : "FiBYw-v_QfO3nJQfHflf_w",
    "shard" : 2,
    "index" : "osm"
  } ], [ {
    "state" : "STARTED",
    "primary" : false,
    "node" : "FiBYw-v_QfO3nJQfHflf_w",
    "relocating_node" : null,
    "shard" : 3,
    "index" : "osm"
  }, {
    "state" : "STARTED",
    "primary" : true,
    "node" : "1DpvDUf7SKywJrBgQqs9eg",
    "relocating_node" : null,
    "shard" : 3,
    "index" : "osm"
  } ], [ {
    "state" : "STARTED",
    "primary" : false,
    "node" : "ibpt8lGiS6yDJf4e09RN9Q",
    "relocating_node" : null,
    "shard" : 4,
    "index" : "osm"
  }, {
    "state" : "STARTED",
    "primary" : true,
    "node" : "FiBYw-v_QfO3nJQfHflf_w",
    "relocating_node" : null,
    "shard" : 4,
    "index" : "osm"
  } ] ]
}

但是服务器上设置的 ES_HEAP_SIZE 是内存的一半:

~$ echo $ES_HEAP_SIZE
7233.0m

而且使用量只有5g:

~$ free -g
             total       used
Mem:            14          5

如果我再等一会儿，节点就会完全离开集群，所有副本都会进入初始化状态，这会使我的插入失败并停止:

{
    "state" : "INITIALIZING",
    "primary" : false,
    "node" : "ibpt8lGiS6yDJf4e09RN9Q",
    "relocating_node" : null,
    "shard" : 3,
    "index" : "osm",
    "unassigned_info" : {
      "reason" : "NODE_LEFT",
      "at" : "2015-10-30T10:53:32.044Z",
      "details" : "node_left[FiBYw-v_QfO3nJQfHflf_w]"
    }

Conf :为了加快插入速度，我在数据节点 elasticsearch 配置上使用了这些参数

刷新间隔:-1，threadpool.bulk.size: 16,threadpool.bulk.queue_size: 1000

为什么会这样？我该如何解决这个问题并让我的批量插入成功？对于最大堆大小，我是否需要超过 50% 的 RAM？

编辑:由于调整 elasticsearch 参数不好，我删除了线程池参数并且它工作但非常慢。 Elasticsearch 并非设计用于过快地摄取过多数据。

最佳答案

删除这些设置:

threadpool.bulk.size: 16
threadpool.bulk.queue_size: 1000

这些设置的默认值应该足以避免集群过载。

并确保按照说明 here 正确调整批量索引过程的大小.根据集群/数据，批量需要具有一定的大小。对于那些希望尽可能摄取的人，您不能使用任何您想要的值。每个集群都有局限性，您应该测试自己的集群。

关于elasticsearch - 为什么分片在批量插入期间被初始化和重新定位，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/33434657/

文章推荐： ruby-on-rails - 如何停止渲染页面/部分

文章推荐： visualization - 如何在 Spotfire 中的过滤器中隐藏特定值？

文章推荐： sql - 如何将LONG强制转换为VARCHAR2内联

文章推荐： Powershell下载并运行exe文件

scala - (重新)在scala中定义()
这个问题在这里已经有了答案: How does Scala's apply() method magic work? (3 个回答) 9年前关闭。假设我在 scala 中有一个 MyList 类，其
python 重新？ : example
这个问题在这里已经有了答案: What is a non-capturing group in regular expressions? (18 个回答) Reference - What does
c++ - (重新)在cpp中没有复制构造函数的情况下初始化对象
这个问题是针对嵌入式系统的! 我有以下选项来初始化一个对象: Object* o = new Object(arg); 这会将对象放入堆中并返回指向它的指针。我不喜欢在嵌入式软件中使用动态分配。 Ob
Python - 重新 - 需要正则表达式的帮助
我自己搜索过，没能成功的正则表达式。我有一个 html 文件，其中包含 [] 之间的变量我想把每一个字都写进去。 [client_name][client_company] [cl
python 重新: no such group
我是 Python 新手。我不明白为什么这段代码不起作用: reOptions = re.search( "[\s+@twitter\s+(?P\w+):(?P.*?)\s+]", d
c - (重新)熟悉一门语言的有效方法是什么？
在过去 7 个月左右的时间里，我几乎一直在使用 .NET C# 进行编程。在那之前，我的大部分编程都是用 C++(从学校里学的)。在工作中，我可能需要在接下来的几个月里做一大堆 C 语言。我对 C 的
python 重新。排除一些结果
我是 RE 的新手，我正在尝试获取歌词并分离出歌词标题、和声和主唱: 下面是一些歌词的例子: [Intro] D.A. got that dope! [Chorus: Travis Scott] Ic
c# - (重新)使用约束类型的泛型参数而不声明它们
这可能是不可能的，但我想检查是否可以用一种简单的方式表达这样的事情: // obviously doesn't work class Foo : IFoo where T: Bar {
MySQL表(重新)设计
我们的应用程序中有“user”和“study”实体，存储在它们各自的表中。一项研究代表一种研究和已收集的数据。它们是多对多的关系，所以我们需要一个链接表:studies_users。我们为用户分配角
database - (重新)命名数据库单元测试中的测试条件
将测试条件添加到 Visual Studio 2010 数据库单元测试(对于 SQL Server 2008)时，这些条件称为例如rowCountCondition1、rowCountConditio
android - (重新)在android模拟器上安装SD卡
在模拟器上，我可以从设置中卸载 SD 卡。然后我可以将它安装到我的操作系统上，然后正常卸载它。我一直无法弄清楚如何在模拟器上重新安装它(无需重新启动)。提示: adb 命令 remount 是无
svn - 如何从颠覆提交中(重新)生成补丁？
假设在一个分支上执行了一系列提交，但该分支尚未与主干重新同步。是否可以从提交中生成全局补丁？是否可以从一系列提交中生成“分组”补丁？如果是，如何？最佳答案 svn diff -rXXX:YYY UR
c# - WPF中的临时锁定窗口(重新)大小
在某些情况下，我想在我的应用程序中锁定调整大小功能，为此我尝试对属性进行数据绑定(bind)，并且不允许在某些情况下更改它，但没有成功。有没有办法这样做？这是我不成功的尝试: XAML: Vie
matlab - 断开显示器连接时(重新)检测连接的显示器数量
当我的计算机连接多个显示器时，我可以检测它们，并根据从获取的值设置位置来向它们绘制图形 get(0, 'MonitorPositions') 但是，当我在 MATLAB 运行时断开监视器时，此属性不会
database - grails如何(重新)连接到第二个数据库
我们有一个grails应用程序，该应用程序在grails数据库中存储了各种域对象。该应用程序连接到第二个数据库，运行一些原始sql，并在表中显示结果。它基本上是一个报告服务器。我们通过在DataSo
c++ - 可以(重新)分配来自不同容器的迭代器吗？
无法比较来自不同容器的迭代器(参见这里的示例: https://stackoverflow.com/a/4664519/225186 )(或者从技术上讲，它不需要有意义。) 这就提出了另一个问题，来自
java - onActivityResult(重新)调用
我有以下情况: 家长 Activity : ParentActivityClass { private Intent intent; @Override public void onCreate(Bu
javascript - Jquery - (重新)连接动态生成的元素
我经常将元素与附加功能 Hook ，例如: $('.myfav').autocomplete(); $('.myfav').datepicker(); $('.myfav').click(somefu
javascript - 如何根据屏幕尺寸(重新)使用不同的选项初始化工具提示？
因此，我将 tooltipster.js 库用于工具提示，并尝试更改工具提示在不同屏幕尺寸上的默认距离。所以这是默认的 init 的样子: $(inputTooltipTrigger).tool
c++ - (重新)实现 dynamic_cast
我在 ARM7 嵌入式环境中工作。我使用的编译器不支持完整的 C++ 功能。它不支持的一项功能是动态类型转换。有没有办法实现dynamic_cast<>() ？我使用 Google 寻找代码，但到

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

elasticsearch - 为什么分片在批量插入期间被初始化和重新定位