gpt4 book ai didi

apache-spark - pyspark中的时间戳解析

转载 作者:行者123 更新时间:2023-12-04 04:48:56 26 4
gpt4 key购买 nike

df1:

Timestamp:

1995-08-01T00:00:01.000+0000

有没有办法使用pyspark在数据框的时间戳列中分隔月份中的某天。无法提供代码,我是新来的 Spark 。我不知道如何继续。

最佳答案

您可以使用 unix_timestamp 解析此时间戳:

from pyspark.sql import functions as F

format = "yyyy-MM-dd'T'HH:mm:ss.SSSZ"
df2 = df1.withColumn('Timestamp2', F.unix_timestamp('Timestamp', format).cast('timestamp'))

然后,您可以在新的时间戳列中使用 dayofmonth:

df2.select(F.dayofmonth('Timestamp2'))

有关这些函数的更多详细信息可以在 pyspark functions documentation 中找到。 .

关于apache-spark - pyspark中的时间戳解析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38810162/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com