gpt4 book ai didi

pyspark - Pyspark 数据框中的填充

转载 作者:行者123 更新时间:2023-12-04 16:26:53 26 4
gpt4 key购买 nike

我有一个 Pyspark 数据框( 原始数据框 )具有以下数据(所有列都有 字符串 数据类型):

  id           Value
1 103
2 1504
3 1

我需要创建一个新的 修改数据框填充 值(value) 列,因此该列的长度应为 4 个字符 .如果长度小于 4 个字符,则在数据中添加 0,如下所示:
  id             Value
1 0103
2 1504
3 0001

有人可以帮我吗?如何使用 Pyspark 数据框实现它?任何帮助将不胜感激。

最佳答案

您可以使用功能模块中的 lpad,

from pyspark.sql.functions import lpad
>>> df.select('id',lpad(df['value'],4,'0').alias('value')).show()
+---+-----+
| id|value|
+---+-----+
| 1| 0103|
| 2| 1504|
| 3| 0001|
+---+-----+

关于pyspark - Pyspark 数据框中的填充,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45400829/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com