gpt4 book ai didi

elasticsearch - 使用Flink Rich InputFormat创建Elasticsearch的输入格式

转载 作者:行者123 更新时间:2023-12-03 02:15:06 25 4
gpt4 key购买 nike

我们正在使用Elasticsearch 6.8.4和Flink 1.0.18。
我们在Elasticsearch中有一个包含1个分片和1个副本的索引,我想创建自定义输入格式,以使用具有超过1个输入分割的apache Flink数据集API在Elasticsearch中读写数据,以实现更好的性能。所以有什么办法可以达到这个要求?
注意:每个文档的大小较大(将近8mb),并且由于尺寸限制,一次只能读取10个文档,并且每个阅读请求都希望检索500k条记录。
根据我的理解,并行度的数量应等于数据源的分片/分区的数量。但是,由于我们仅存储少量数据,因此分片数量仅保持为1,而我们拥有的静态数据每个月的增加很少。
任何帮助或源代码示例将不胜感激。

最佳答案

您需要能够生成对ES的查询,以将源数据有效地划分为相对相等的块。然后,您可以以大于1的并行度运行输入源,并使每个子任务仅读取索引数据的一部分。

关于elasticsearch - 使用Flink Rich InputFormat创建Elasticsearch的输入格式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63747019/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com