gpt4 book ai didi

java - 将spark中的现有行添加到另一个数据集(Spark Java 2.3.1)

转载 作者:行者123 更新时间:2023-12-02 11:01:37 25 4
gpt4 key购买 nike

我必须有 2 个数据集:

  • 数据集 A:原始
  • 数据集 B:数据集 A 的外推

A和B之间是双射关系

我可以将这两个数据集嵌套到一个数据集中,这样当它转换为 json 对象时,只有一个内部对象代表数据集 B 中的该元素行。

最终产品应该是

{  
Dataset-A
{
Dataset-B-Object
}
}

最佳答案

你根本不可能做到这一点。我们正在讨论 Spark,而不是您想要从数据集创建的一些 Web API。

您可以将两个数据集合并为一个数据集

datasetA.union(datasetB)

结果将是一个连接在一起的数据集。

关于java - 将spark中的现有行添加到另一个数据集(Spark Java 2.3.1),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51295228/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com