gpt4 book ai didi

elasticsearch - 在 spark-submit 中设置 elasticsearch 属性

转载 作者:行者123 更新时间:2023-11-29 02:52:13 25 4
gpt4 key购买 nike

我正尝试使用 spark-submit 通过命令行启动使用 Elastic Search 输入的 Spark 作业,如 http://www.elasticsearch.org/guide/en/elasticsearch/hadoop/current/spark.html 中所述

我在一个文件中设置属性,但是在启动 spark-submit 时它给出了以下警告:

~/spark-1.0.1-bin-hadoop1/bin/spark-submit --class Main --properties-file spark.conf SparkES.jar

Warning: Ignoring non-spark config property: es.resource=myresource
Warning: Ignoring non-spark config property: es.nodes=mynode
Warning: Ignoring non-spark config property: es.query=myquery
...
Exception in thread "main" org.elasticsearch.hadoop.rest.EsHadoopNoNodesLeftException: Connection error (check network and/or proxy settings)- all nodes failed

我的配置文件看起来像(具有正确的值):

es.nodes      nodeip:port
es.resource index/type
es.query query

在代码中的 Configuration 对象中设置属性是可行的,但我需要避免这种解决方法。

有没有办法通过命令行设置这些属性?

最佳答案

我不知道您是否解决了您的问题(如果是,如何解决?),但我找到了这个解决方案:

import org.elasticsearch.spark.rdd.EsSpark

EsSpark.saveToEs(rdd, "spark/docs", Map("es.nodes" -> "10.0.5.151"))

再见

关于elasticsearch - 在 spark-submit 中设置 elasticsearch 属性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25238408/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com