gpt4 book ai didi

apache-spark - SAP Vora 2.1 是否需要 Hadoop/Spark 集群?并且可以使用 PySpark 吗?

转载 作者:可可西里 更新时间:2023-11-01 16:28:18 24 4
gpt4 key购买 nike

根据文档 SAP_Vora_Installation_Admin_Guide_2.0_en.pdf,需要运行 Hadoop/Spark 集群和运行 Kubernetis 集群。

现在我的问题是,为什么需要这个 Hadoop/Spark 集群?因为 SAP Vora 可以从 HDFS、WebHDFS 等读取。

如果您有一个 Spark 作业,您是否可以在 Spark 集群上运行它,如果它需要来自 HANA/Vora 的数据,它可以访问它吗?还是 Vora 也使用 Spark 集群来处理数据?

因为现在看起来 Spark 可以使用 Vora 但 Vora 不能使用 Spark(Vora UI 工具,如 SQL 编辑器等)。因为你可以附加到 Vora 上的 Zeppelin 只是用于可视化(据我了解,如果我错了请纠正我)。

我的第二个问题是,是否可以在 Hadoop/Spark 集群上使用 PySpark 与 Vora 而不仅仅是 Scala Spark 进行交互。

提前致谢。

最佳答案

是的,您的假设是正确的:Spark 可以访问 Vora 2.1,但 Vora 2.1 无法与 Spark 交互,因此不需要 Hadoop/Spark 集群可用。但是,如果您没有 Hadoop,那么您必须有一个替代数据存储来加载数据,例如S3,ADL。

是的,可以使用 PySpark 与 Vora 交互。

关于apache-spark - SAP Vora 2.1 是否需要 Hadoop/Spark 集群?并且可以使用 PySpark 吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50504348/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com