gpt4 book ai didi

scala - 如何从Spark中的多个Elasticsearch索引读取?

转载 作者:行者123 更新时间:2023-12-03 01:38:43 25 4
gpt4 key购买 nike

我需要从Elasticsearch的多个索引中读取数据。但是所有这些索引都具有相同的数据结构。

例如:

val df1 = spark.read.format("org.elasticsearch.spark.sql")
.option("query", myquery)
.option("pushdown", "true")
.load("news_01/myitem")

val df2 = spark.read.format("org.elasticsearch.spark.sql")
.option("query", myquery)
.option("pushdown", "true")
.load("news_02/myitem")

如果得到索引名称为 ["news_01", "news_02"]的数组会怎样?

如何避免像现在这样创建 df1df2

最佳答案

鉴于ElasticSearch允许您在搜索请求期间同时定位多个索引,您可以执行以下操作:

val df = spark.read.format("org.elasticsearch.spark.sql")
.option("query", myquery)
.option("pushdown", "true")
.load("news_01,news_02")

关于scala - 如何从Spark中的多个Elasticsearch索引读取?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49999685/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com