gpt4 book ai didi

scala - 如何加入具有相同列的数据集并选择一个?

转载 作者:行者123 更新时间:2023-12-03 23:37:26 25 4
gpt4 key购买 nike

我有两个 Spark 数据帧,我将加入并在之后进行选择。我想选择其中一个数据框的特定列。但在另一个中存在相同的列名。因此,我收到了歧义列的异常。

我试过这个:

d1.as("d1").join(d2.as("d2"), $"d1.id" === $"d2.id", "left").select($"d1.columnName")

和这个:
d1.join(d2, d1("id") === d2("id"), "left").select($"d1.columnName")

但它不起作用。

最佳答案

您使用的是哪个 Spark 版本?你能放一个你的数据框样本吗?
尝试这个:

d2prim = d2.withColumnRenamed("columnName", d2_columnName)   
d1.join(d2prim , Seq("id"), "left_outer").select("columnName")

关于scala - 如何加入具有相同列的数据集并选择一个?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48009318/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com