gpt4 book ai didi

python - 用 pyspark 替换数据框中一列的所有值

转载 作者:太空宇宙 更新时间:2023-11-03 15:02:28 25 4
gpt4 key购买 nike

我希望用特定值替换 spark 数据框中列的所有值。我正在使用 pyspark。我试过类似的东西-

new_df = df.withColumn('column_name',10)

这里我想将 column_name 列中的所有值替换为 10。在 Pandas 中,这可以通过df['column_name']=10。我无法弄清楚如何在 Spark 中执行相同的操作。

最佳答案

使用 lit 可能更容易,如下所示:

from pyspark.sql.functions import lit
new_df = df.withColumn('column_name', lit(10))

关于python - 用 pyspark 替换数据框中一列的所有值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36295739/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com