gpt4 book ai didi

java - 如何在 Java 中追加两个具有不同列的 Spark Dataframe

转载 作者:行者123 更新时间:2023-12-01 18:42:04 32 4
gpt4 key购买 nike

我有一个 Dataframe,正在其上执行一个 UDF 操作,然后 UDF 操作只给出 Dataframe 中的一列。我如何将它附加到以前的数据帧。例子:数据框1:sr_no,姓名,工资

Dataframe 2:UDF 提供 ABS(薪水)输出 - 只有一列作为应用于 Dataframe1 的 UDF 输出

我如何在JAVA中将输出数据帧作为Dataframe1 + Dataframe2即 sr_no、姓名、工资、ABS(Salary) 输出

最佳答案

看起来您正在搜索 .withColumn 方法:

df1.withColumn("ABS(salary)", yourUdf.apply(col("salary")))

(代码片段需要从 org.apache.spark.sql.functions 导入静态方法 col)

关于java - 如何在 Java 中追加两个具有不同列的 Spark Dataframe,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59910235/

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com