gpt4 book ai didi

apache-spark - Bluemix Spark 服务

转载 作者:行者123 更新时间:2023-12-04 04:55:02 24 4
gpt4 key购买 nike

首先,我需要承认我是 Bluemix 和 Spark 的新手。我只想尝试使用 Bluemix Spark 服务。

我想对一个文本文件中的十亿条记录执行批处理操作,然后我想用我自己的一组 Java API 处理这些记录。

这是我想使用 Spark 服务来加快数据集处理速度的地方。

这是我的问题:

  1. 我可以从 Python 调用 Java 代码吗?据我了解,目前仅支持 Python 样板文件?在我的 Java API 下也有一些 JNI。

  2. 我可以使用 Bluemix Spark 服务执行批处理操作还是仅用于交互目的?

  3. 我可以使用 Bluemix 创建类似管道的东西(一个阶段的输出到另一个阶段)吗,我需要为它编写代码吗?

对于上述问题,我将不胜感激。

在此期待一些专家的建议。

谢谢。

最佳答案

IBM Analytics for Apache Spark 服务现已可用,它允许您使用 spark-submit 以及适用于 python/scala 的笔记本界面提交 java 代码/批处理程序。

之前,测试代码仅限于笔记本交互界面。

问候阿努普

关于apache-spark - Bluemix Spark 服务,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32940788/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com