gpt4 book ai didi

apache-spark - 成功创建 Spark 上下文后,Livy session 卡在启动

转载 作者:行者123 更新时间:2023-12-03 20:52:43 26 4
gpt4 key购买 nike

我一直在尝试使用在 Ubuntu 18.04 上运行的 Livy 0.7 服务器创建一个新的 spark session 。
在同一台机器上,我有一个正在运行的 Spark 集群,有 2 个 worker ,我能够创建一个正常的 Spark session 。
我的问题是,在对 Livy 服务器运行以下请求后, session 停留在启动状态:

import json, pprint, requests, textwrap
host = 'http://localhost:8998'
data = {'kind': 'spark'}
headers = {'Content-Type': 'application/json'}
r = requests.post(host + '/sessions', data=json.dumps(data), headers=headers)
r.json()
我可以看到 session 正在启动并从 session 日志中创建了 spark session :
20/06/03 13:52:31 INFO SparkEntries: Spark context finished initialization in 5197ms
20/06/03 13:52:31 INFO SparkEntries: Created Spark session.
20/06/03 13:52:46 INFO CoarseGrainedSchedulerBackend$DriverEndpoint: Registered executor NettyRpcEndpointRef(spark-client://Executor) (xxx.xx.xx.xxx:1828) with ID 0
20/06/03 13:52:47 INFO BlockManagerMasterEndpoint: Registering block manager xxx.xx.xx.xxx:1830 with 434.4 MB RAM, BlockManagerId(0, xxx.xx.xx.xxx, 1830, None)
也来自 Spark 主用户界面:
spark runing applications
livy.rsc.server.idle-timeout 之后到达 session 日志然后输出:
20/06/03 14:28:04 WARN RSCDriver: Shutting down RSC due to idle timeout (10m).
20/06/03 14:28:04 INFO SparkUI: Stopped Spark web UI at http://172.17.52.209:4040
20/06/03 14:28:04 INFO StandaloneSchedulerBackend: Shutting down all executors
20/06/03 14:28:04 INFO CoarseGrainedSchedulerBackend$DriverEndpoint: Asking each executor to shut down
20/06/03 14:28:04 INFO MapOutputTrackerMasterEndpoint: MapOutputTrackerMasterEndpoint stopped!
20/06/03 14:28:04 INFO MemoryStore: MemoryStore cleared
20/06/03 14:28:04 INFO BlockManager: BlockManager stopped
20/06/03 14:28:04 INFO BlockManagerMaster: BlockManagerMaster stopped
20/06/03 14:28:04 INFO OutputCommitCoordinator$OutputCommitCoordinatorEndpoint: OutputCommitCoordinator stopped!
20/06/03 14:28:04 INFO SparkContext: Successfully stopped SparkContext
20/06/03 14:28:04 INFO SparkContext: SparkContext already stopped.
然后死了:(
enter image description here
我已经尝试过增加驱动程序超时,但没有发现任何类似的已知问题
我猜这与 Spark 驱动程序与 rsc 的连接有关,但我不知道在哪里配置它
有人知道原因/解决方案吗?

最佳答案

我们在其中一个环境中遇到了类似的问题。工作环境和非工作环境之间的唯一区别是 livy.conf 文件中的 spark master 设置。
我从 livy.conf 中删除了配置 livy.spark.master=yarn 并从代码本身设置了这个值。

// pass master as yarn 
public static JavaSparkContext getSparkContext(final String master, final String appName) {

LOGGER.info("Creating spark context");
SparkConf conf = new SparkConf().setAppName(appName);
if (Strings.isNullOrEmpty(master)) {
LOGGER.warn("No spark master found setting local!!");
conf.setMaster("local");
} else {
conf.setMaster(master);
}
conf.set("spark.submit.deployMode", "client");
return new JavaSparkContext(conf);
}
这对我有用。
如果有人能指出这对我来说是如何工作的,那将会有所帮助。

关于apache-spark - 成功创建 Spark 上下文后,Livy session 卡在启动,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62175574/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com