gpt4 book ai didi

date - Pyspark:如何将十天添加到现有日期列

转载 作者:行者123 更新时间:2023-12-04 17:30:32 31 4
gpt4 key购买 nike

我在Pyspark中有一个数据框,其中的日期列称为“report_date”。

我想创建一个名为“report_date_10”的新列,该列将添加到原始report_date列中为10天。

下面是我尝试的代码:

df_dc["report_date_10"] = df_dc["report_date"] + timedelta(days=10)

这是我得到的错误:

AttributeError:“datetime.timedelta”对象没有属性“_get_object_id”

帮助!谢谢

最佳答案

看来您正在使用pandas语法添加一列;对于Spark,您需要使用withColumn添加新列;要添加日期,有内置的date_add函数:

import pyspark.sql.functions as F
df_dc = spark.createDataFrame([['2018-05-30']], ['report_date'])

df_dc.withColumn('report_date_10', F.date_add(df_dc['report_date'], 10)).show()
+-----------+--------------+
|report_date|report_date_10|
+-----------+--------------+
| 2018-05-30| 2018-06-09|
+-----------+--------------+

关于date - Pyspark:如何将十天添加到现有日期列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50703284/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com