gpt4 book ai didi

apache-spark - 在 pyspark 中将 yyyymmdd 格式转换为 MM-dd-yyyy 格式

转载 作者:行者123 更新时间:2023-12-05 01:45:33 31 4
gpt4 key购买 nike

我有一个大型数据框 df,其中包含格式为 yyyymmdd 的日期列,如何在 pySpark 中将其转换为 MM-dd-yyyy

最佳答案

from datetime import datetime
from pyspark.sql.functions import col,udf
from pyspark.sql.types import DateType


rdd = sc.parallelize(['20161231', '20140102', '20151201', '20161124'])
df1 = sqlContext.createDataFrame(rdd, ['old_col'])

# UDF to convert string to date
func = udf (lambda x: datetime.strptime(x, '%Y%m%d'), DateType())

df = df1.withColumn('new_col', date_format(func(col('old_col')), 'MM-dd-yyy'))

df.show()

关于apache-spark - 在 pyspark 中将 yyyymmdd 格式转换为 MM-dd-yyyy 格式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41392303/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com