gpt4 book ai didi

java - 将条目插入ElasticSearch的最佳方法是什么?

转载 作者:行者123 更新时间:2023-12-02 22:39:53 26 4
gpt4 key购买 nike

我是ElasticSearch的新手,我有180个字段和1200万行的文件。我已经在ElasticSearch和Java程序中创建了索引并输入了索引,但是需要1.5个小时。还有其他最佳方法可以减少时间将数据加载到ElasticSearch中。我尝试了map reduce程序,但有时它会失败并生成重复的条目,并且比我的顺序程序花费更多的时间。

有人可以提出好的建议吗?

最佳答案

您可以在使用ES-hadoop插件时禁用推测性执行,以避免重复输入。使用map-reduce索引数据时,请尝试微调批量api的批处理大小。
有关更多信息,请引用:-https://www.elastic.co/guide/en/elasticsearch/hadoop/current/configuration.html并尝试更改默认值以获得最佳性能。还尝试增加ES堆大小。您也可以使用apache Tika或ES的mapper附件插件从文件中提取信息。

希望能帮助到你!

关于java - 将条目插入ElasticSearch的最佳方法是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34723335/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com