- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试将数据批量插入到具有 3 个数据节点的 4 节点 Elasticsearch 集群中。
数据节点规范:16 个 CPU - 7GB 内存 - 500GB SSD
数据被插入到非数据节点上并拆分成 5 个分片并设置为具有 1 个副本。大约有 250GB 的数据要插入。
然而,在每个节点上插入约 40GB 的数据并处理一小时后,同时在整个时间跨度内最大使用 CPU 约 60% 和 RAM 约 30% 后,一些分片进入初始化状态:
~$ curl -XGET 'http://localhost:9200/_cluster/health/osm?level=shards&pretty=true'
{
"cluster_name" : "elastic_osm",
"status" : "yellow",
"timed_out" : false,
"number_of_nodes" : 4,
"number_of_data_nodes" : 3,
"active_primary_shards" : 5,
"active_shards" : 9,
"relocating_shards" : 1,
"initializing_shards" : 1,
"unassigned_shards" : 0,
"delayed_unassigned_shards" : 0,
"number_of_pending_tasks" : 0,
"number_of_in_flight_fetch" : 0,
"indices" : {
"osm" : {
"status" : "yellow",
"number_of_shards" : 5,
"number_of_replicas" : 1,
"active_primary_shards" : 5,
"active_shards" : 9,
"relocating_shards" : 1,
"initializing_shards" : 1,
"unassigned_shards" : 0,
"shards" : {
"0" : {
"status" : "yellow",
"primary_active" : true,
"active_shards" : 1,
"relocating_shards" : 0,
"initializing_shards" : 1,
"unassigned_shards" : 0
},
"1" : {
"status" : "green",
"primary_active" : true,
"active_shards" : 2,
"relocating_shards" : 0,
"initializing_shards" : 0,
"unassigned_shards" : 0
},
"2" : {
"status" : "green",
"primary_active" : true,
"active_shards" : 2,
"relocating_shards" : 1,
"initializing_shards" : 0,
"unassigned_shards" : 0
},
"3" : {
"status" : "green",
"primary_active" : true,
"active_shards" : 2,
"relocating_shards" : 0,
"initializing_shards" : 0,
"unassigned_shards" : 0
},
"4" : {
"status" : "green",
"primary_active" : true,
"active_shards" : 2,
"relocating_shards" : 0,
"initializing_shards" : 0,
"unassigned_shards" : 0
}
}
}
}
}
再深入一点,我发现有一个节点的堆空间有问题:
~$ curl -XGET 'localhost:9200/osm/_search_shards?pretty=true'
{
"nodes" : {
"1DpvDUf7SKywJrBgQqs9eg" : {
"name" : "elastic-osm-node-1",
"transport_address" : "inet[/xxx.xxx.x.x:xxxx]",
"attributes" : {
"master" : "true"
}
},
"FiBYw-v_QfO3nJQfHflf_w" : {
"name" : "elastic-osm-node-3",
"transport_address" : "inet[/xxx.xxx.x.x:x]",
"attributes" : {
"master" : "true"
}
},
"ibpt8lGiS6yDJf4e09RN9Q" : {
"name" : "elastic-osm-node-2",
"transport_address" : "inet[/xxx.xxx.x.x:xxxx]",
"attributes" : {
"master" : "true"
}
}
},
"shards" : [ [ {
"state" : "STARTED",
"primary" : true,
"node" : "ibpt8lGiS6yDJf4e09RN9Q",
"relocating_node" : null,
"shard" : 0,
"index" : "osm"
}, {
"state" : "INITIALIZING",
"primary" : false,
"node" : "FiBYw-v_QfO3nJQfHflf_w",
"relocating_node" : null,
"shard" : 0,
"index" : "osm",
"unassigned_info" : {
"reason" : "ALLOCATION_FAILED",
"at" : "2015-10-30T10:42:25.539Z",
"details" : "shard failure [engine failure, reason [already closed by tragic event]][OutOfMemoryError[Java heap space]]"
}
} ], [ {
"state" : "STARTED",
"primary" : true,
"node" : "FiBYw-v_QfO3nJQfHflf_w",
"relocating_node" : null,
"shard" : 1,
"index" : "osm"
}, {
"state" : "STARTED",
"primary" : false,
"node" : "1DpvDUf7SKywJrBgQqs9eg",
"relocating_node" : null,
"shard" : 1,
"index" : "osm"
} ], [ {
"state" : "RELOCATING",
"primary" : false,
"node" : "FiBYw-v_QfO3nJQfHflf_w",
"relocating_node" : "1DpvDUf7SKywJrBgQqs9eg",
"shard" : 2,
"index" : "osm"
}, {
"state" : "STARTED",
"primary" : true,
"node" : "ibpt8lGiS6yDJf4e09RN9Q",
"relocating_node" : null,
"shard" : 2,
"index" : "osm"
}, {
"state" : "INITIALIZING",
"primary" : false,
"node" : "1DpvDUf7SKywJrBgQqs9eg",
"relocating_node" : "FiBYw-v_QfO3nJQfHflf_w",
"shard" : 2,
"index" : "osm"
} ], [ {
"state" : "STARTED",
"primary" : false,
"node" : "FiBYw-v_QfO3nJQfHflf_w",
"relocating_node" : null,
"shard" : 3,
"index" : "osm"
}, {
"state" : "STARTED",
"primary" : true,
"node" : "1DpvDUf7SKywJrBgQqs9eg",
"relocating_node" : null,
"shard" : 3,
"index" : "osm"
} ], [ {
"state" : "STARTED",
"primary" : false,
"node" : "ibpt8lGiS6yDJf4e09RN9Q",
"relocating_node" : null,
"shard" : 4,
"index" : "osm"
}, {
"state" : "STARTED",
"primary" : true,
"node" : "FiBYw-v_QfO3nJQfHflf_w",
"relocating_node" : null,
"shard" : 4,
"index" : "osm"
} ] ]
}
但是服务器上设置的 ES_HEAP_SIZE 是内存的一半:
~$ echo $ES_HEAP_SIZE
7233.0m
而且使用量只有5g:
~$ free -g
total used
Mem: 14 5
如果我再等一会儿,节点就会完全离开集群,所有副本都会进入初始化状态,这会使我的插入失败并停止:
{
"state" : "INITIALIZING",
"primary" : false,
"node" : "ibpt8lGiS6yDJf4e09RN9Q",
"relocating_node" : null,
"shard" : 3,
"index" : "osm",
"unassigned_info" : {
"reason" : "NODE_LEFT",
"at" : "2015-10-30T10:53:32.044Z",
"details" : "node_left[FiBYw-v_QfO3nJQfHflf_w]"
}
Conf :为了加快插入速度,我在数据节点 elasticsearch 配置上使用了这些参数
刷新间隔:-1,threadpool.bulk.size: 16,threadpool.bulk.queue_size: 1000
为什么会这样?我该如何解决这个问题并让我的批量插入成功?对于最大堆大小,我是否需要超过 50% 的 RAM?
编辑:由于调整 elasticsearch 参数不好,我删除了线程池参数并且它工作但非常慢。 Elasticsearch 并非设计用于过快地摄取过多数据。
最佳答案
删除这些设置:
threadpool.bulk.size: 16
threadpool.bulk.queue_size: 1000
这些设置的默认值应该足以避免集群过载。
并确保按照说明 here 正确调整批量索引过程的大小.根据集群/数据,批量需要具有一定的大小。对于那些希望尽可能摄取的人,您不能使用任何您想要的值。每个集群都有局限性,您应该测试自己的集群。
关于elasticsearch - 为什么分片在批量插入期间被初始化和重新定位,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33434657/
这个问题在这里已经有了答案: How does Scala's apply() method magic work? (3 个回答) 9年前关闭。 假设我在 scala 中有一个 MyList 类,其
这个问题在这里已经有了答案: What is a non-capturing group in regular expressions? (18 个回答) Reference - What does
这个问题是针对嵌入式系统的! 我有以下选项来初始化一个对象: Object* o = new Object(arg); 这会将对象放入堆中并返回指向它的指针。我不喜欢在嵌入式软件中使用动态分配。 Ob
我自己搜索过,没能成功的正则表达式。 我有一个 html 文件,其中包含 [] 之间的变量我想把每一个字都写进去。 [client_name][client_company] [cl
我是 Python 新手。我不明白为什么这段代码不起作用: reOptions = re.search( "[\s+@twitter\s+(?P\w+):(?P.*?)\s+]", d
在过去 7 个月左右的时间里,我几乎一直在使用 .NET C# 进行编程。在那之前,我的大部分编程都是用 C++(从学校里学的)。在工作中,我可能需要在接下来的几个月里做一大堆 C 语言。我对 C 的
我是 RE 的新手,我正在尝试获取歌词并分离出歌词标题、和声和主唱: 下面是一些歌词的例子: [Intro] D.A. got that dope! [Chorus: Travis Scott] Ic
这可能是不可能的,但我想检查是否可以用一种简单的方式表达这样的事情: // obviously doesn't work class Foo : IFoo where T: Bar {
我们的应用程序中有“user”和“study”实体,存储在它们各自的表中。一项研究代表一种研究和已收集的数据。它们是多对多的关系,所以我们需要一个链接表:studies_users。 我们为用户分配角
将测试条件添加到 Visual Studio 2010 数据库单元测试(对于 SQL Server 2008)时,这些条件称为例如rowCountCondition1、rowCountConditio
在模拟器上,我可以从设置中卸载 SD 卡。 然后我可以将它安装到我的操作系统上,然后正常卸载它。 我一直无法弄清楚如何在模拟器上重新安装它(无需重新启动)。 提示: adb 命令 remount 是无
假设在一个分支上执行了一系列提交,但该分支尚未与主干重新同步。是否可以从提交中生成全局补丁?是否可以从一系列提交中生成“分组”补丁?如果是,如何? 最佳答案 svn diff -rXXX:YYY UR
在某些情况下,我想在我的应用程序中锁定调整大小功能,为此我尝试对属性进行数据绑定(bind),并且不允许在某些情况下更改它,但没有成功。 有没有办法这样做? 这是我不成功的尝试: XAML: Vie
当我的计算机连接多个显示器时,我可以检测它们,并根据从获取的值设置位置来向它们绘制图形 get(0, 'MonitorPositions') 但是,当我在 MATLAB 运行时断开监视器时,此属性不会
我们有一个grails应用程序,该应用程序在grails数据库中存储了各种域对象。该应用程序连接到第二个数据库,运行一些原始sql,并在表中显示结果。它基本上是一个报告服务器。 我们通过在DataSo
无法比较来自不同容器的迭代器(参见这里的示例: https://stackoverflow.com/a/4664519/225186 )(或者从技术上讲,它不需要有意义。) 这就提出了另一个问题,来自
我有以下情况: 家长 Activity : ParentActivityClass { private Intent intent; @Override public void onCreate(Bu
我经常将元素与附加功能 Hook ,例如: $('.myfav').autocomplete(); $('.myfav').datepicker(); $('.myfav').click(somefu
因此,我将 tooltipster.js 库用于工具提示,并尝试更改工具提示在不同屏幕尺寸上的默认距离。 所以这是默认的 init 的样子: $(inputTooltipTrigger).tool
我在 ARM7 嵌入式环境中工作。我使用的编译器不支持完整的 C++ 功能。它不支持的一项功能是动态类型转换。 有没有办法实现dynamic_cast<>() ? 我使用 Google 寻找代码,但到
我是一名优秀的程序员,十分优秀!