gpt4 book ai didi

scala - 简单esRDD(Spark中使用的Elasticsearch-hadoop连接器)引发了异常

转载 作者:行者123 更新时间:2023-12-03 01:48:51 26 4
gpt4 key购买 nike

我正在使用在Elasticsearch中加载的一些测试数据在localhost上测试ElasticSearch和Spark集成(带有elasticsearch-hadoop连接器)。调用交互式 shell :

] $SPARK_HOME/bin/spark-shell --master local[4] --jars ~/spark/jars/elasticsearch-hadoop-5.2.0.jar --conf spark.es.nodes="localhost" spark.es.port="9200" spark.es.resource="myindex/mytype"

scala> import org.elasticsearch.spark._
scala> val my_rdd = sc.esRDD("myindex/mytype")

my_rdd: org.apache.spark.rdd.RDD[(String, scala.collection.Map[String,AnyRef])] = ScalaEsRDD[0] at RDD at AbstractEsRDD.scala:34

但是以下操作引发异常并使Spark退出:
scala> my_rdd.take(3).foreach(println)

17/02/02 14:08:18 ERROR executor.Executor: Exception in task 0.0 in stage 0.0 (TID 0)
java.lang.NoClassDefFoundError: scala/collection/GenTraversableOnce$class
at org.elasticsearch.spark.rdd.AbstractEsRDDIterator.<init>(AbstractEsRDDIterator.scala:28)
at org.elasticsearch.spark.rdd.ScalaEsRDDIterator.<init>(ScalaEsRDD.scala:43)
at org.elasticsearch.spark.rdd.ScalaEsRDD.compute(ScalaEsRDD.scala:39)
...
...
Driver stacktrace:))

]

版本:
ES:2.4.2
Spark :2.0.1
elasticsearch-hadoop:5.2.0

版本之间可能会发生冲突吗?有没有办法在没有elasticsearch-hadoop连接器的情况下测试ES连接?
任何提示表示赞赏!

最佳答案

从Spark 2.0开始,默认情况下使用Scala 2.11构建Spark。所以
您需要下载针对Scala 2.11构建的2.0版 Elasticsearch Spark 连接器。

您可以从here下载它。

关于scala - 简单esRDD(Spark中使用的Elasticsearch-hadoop连接器)引发了异常,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42010632/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com