gpt4 book ai didi

apache-spark - 如何使用相同的 spark 上下文并行运行多个 spark 作业?

转载 作者:行者123 更新时间:2023-12-04 04:43:10 29 4
gpt4 key购买 nike

有没有办法在不同线程中使用相同的 spark 上下文并行运行多个 spark 作业?

我尝试使用 Vertx 3,但看起来每个作业都在排队并按顺序启动。

如何让它在相同的 spark 上下文中同时运行?

这是我的示例代码:

 vertx.executeBlocking(future -> {
DataFrame dataframe = sqlContext.sql(sql);

Row[] result = dataframe.collect();
System.out.println("Query result for " + sql);
LOG.info("Query result for " + sql);

if (result == null) {
LOG.info("No result!");
} else {
for (Row row : result) {
LOG.info(":::" + row.toString());
}
}
future.complete(true);
}, res -> {
if (res.succeeded()){
LOG.info("Query finished");
}else{
LOG.info("Query failed " + res.cause().getMessage());
res.cause().printStackTrace();
}
});

最佳答案

如何使用 AsyncRDDActions ?我刚刚测试并运行两个 collectAsync 确实是并行运行的。

关于apache-spark - 如何使用相同的 spark 上下文并行运行多个 spark 作业?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32235908/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com