gpt4 book ai didi

apache-spark - 如何使用pyspark对数据框中的两列进行数学运算

转载 作者:行者123 更新时间:2023-12-04 17:16:29 24 4
gpt4 key购买 nike

我有三列“x”、“y”和“z”的数据框

x        y         z
bn 12452 221
mb 14521 330
pl 12563 160
lo 22516 142

我需要创建一个由这个公式派生的另一列
(m = z / y+z)

所以新的数据框应该是这样的:
x        y         z        m
bn 12452 221 .01743
mb 14521 330 .02222
pl 12563 160 .01257
lo 22516 142 .00626

最佳答案

df = sqlContext.createDataFrame([('bn', 12452, 221), ('mb', 14521, 330)], ['x', 'y', 'z'])
df = df.withColumn('m', df['z'] / (df['y'] + df['z']))
df.head(2)

关于apache-spark - 如何使用pyspark对数据框中的两列进行数学运算,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40728017/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com