gpt4 book ai didi

elasticsearch - SPARK的 Elasticsearch 连接器

转载 作者:行者123 更新时间:2023-12-02 23:48:38 28 4
gpt4 key购买 nike

用例:
应用程序使用spark处理数据5分钟,要处理的数据可能是数据存储中数十万条记录的数据。
数据存储的选择是Elastic Search。

问题:
我们在Elasticsearch中是否有用于 Spark 的连接器,类似于MongoDB中的连接器?

https://www.mongodb.com/products/spark-connector

调查:
我花了很多时间,但是我能找到的最好的方法是使用带有滚动的搜索API的解决方案(我们可以在给定的数量间隔内获取有限数量的记录),但这不适合我的用例。

请注意,我的 flex 搜索将包含JSON数据,我们不想保存RDD。
如下所述

https://www.elastic.co/guide/en/elasticsearch/hadoop/master/spark.html

最佳答案

您可以将spark连接器用于ES,并且数据不会以任何二进制形式保存-但是RDD / Dataframe会序列化为JSON,这就是Elasticsearch的内容。

关于elasticsearch - SPARK的 Elasticsearch 连接器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59377230/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com