gpt4 book ai didi

python - 如何在 Zeppelin 中的 %pyspark 解释器和 %python 解释器之间传递数据集?

转载 作者:行者123 更新时间:2023-12-01 09:07:40 24 4
gpt4 key购买 nike

我正在编写一段代码,使用内部库和 %pyspark 解释器获取数据集。 但是我无法将数据集传递给 %python 解释器。我尝试使用字符串变量并且工作正常,但是对于数据集,我使用以下代码将数据集放入飞艇上下文中 - z.put("input_data",input_data)

它抛出以下错误:

属性错误:“DataFrame”对象没有属性“_get_object_id”

你能告诉我该怎么做吗?提前致谢。

最佳答案

您可以通过打印到%table将结果放入ResourcePool中。

%python
print('%table a\tb\n408+\t+408\n0001\t++99\n40817810300001453030\t0000040817810300001453030')

那就这样吧。

%spark.pyspark
ic = z.getInterpreterContext()
pool = ic.getResourcePool()
paragraphId = "20180828-093109_1491500809"
t = pool.get(ic.getNoteId(), paragraphId, "zeppelin.paragraph.result.table").get().toString()

print(t)

这种方式允许传输多达 50-100 MB 的原始数据。

无论如何,我建议遵循@zjffdu 仅使用这些解释器之一。

关于python - 如何在 Zeppelin 中的 %pyspark 解释器和 %python 解释器之间传递数据集?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51915908/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com