gpt4 book ai didi

datetime - 从 Pyspark 中包含时间戳的字符串列中提取日期

转载 作者:行者123 更新时间:2023-12-04 16:51:34 25 4
gpt4 key购买 nike

我有一个数据框,它的日期格式如下:

+----------------------+
|date |
+----------------------+
|May 6, 2016 5:59:34 AM|
+----------------------+

我打算以格式 YYYY-MM-DD 从中提取日期;所以结果应该是上述日期 - 2016-05-06。

但是当我提取时使用以下内容:
df.withColumn('part_date', from_unixtime(unix_timestamp(df.date, "MMM dd, YYYY hh:mm:ss aa"), "yyyy-MM-dd"))

我得到以下日期
2015-12-27

有人可以就此提出建议吗?我不打算将我的 df 转换为 rdd 以使用来自 python 的 datetime 函数,并希望在它自己的数据帧中使用它。

最佳答案

你的模式有一些错误。这是一个建议:

from_pattern = 'MMM d, yyyy h:mm:ss aa'
to_pattern = 'yyyy-MM-dd'
df.withColumn('part_date', from_unixtime(unix_timestamp(df['date'], from_pattern), to_pattern)).show()
+----------------------+----------+
|date |part_date |
+----------------------+----------+
|May 6, 2016 5:59:34 AM|2016-05-06|
+----------------------+----------+

关于datetime - 从 Pyspark 中包含时间戳的字符串列中提取日期,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37330866/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com