gpt4 book ai didi

python - 将另一列的分钟数添加到 pyspark 中的字符串时间列

转载 作者:行者123 更新时间:2023-12-04 14:03:23 24 4
gpt4 key购买 nike

我有下面的 pyspark 数据框。它们都是字符串列。

time     additional_time_in_mins
11:00:00 60
13:00:00 60
14:00:00 30

我必须将附加时间列中的分钟添加到实际时间,并在 pyspark 中创建如下输出。

预期输出:

new_time
12:00:00
14:00:00
14:30:00

有没有办法在pyspark中做到这一点

最佳答案

一个简单的选项是使用 unix_timestamp 函数在几秒钟内将 time 列转换为 bigint,添加分钟(分钟 * 60s),然后将结果转换回时间戳
最后,转换为小时格式。

df = df.withColumn('new_time', F.date_format((F.unix_timestamp('time', 'HH:mm:ss') + F.col('additional_time_in_mins')*60).cast('timestamp'), 'HH:mm:ss'))

df.show()

+--------+-----------------------+--------+
| time|additional_time_in_mins|new_time|
+--------+-----------------------+--------+
|11:00:00| 60|12:00:00|
|13:00:00| 60|14:00:00|
|14:00:00| 30|14:30:00|
+--------+-----------------------+--------+

关于python - 将另一列的分钟数添加到 pyspark 中的字符串时间列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/69278747/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com