gpt4 book ai didi

python - 在python中的数据表框架中将字符串列转换为日期格式

转载 作者:行者123 更新时间:2023-12-04 04:10:19 27 4
gpt4 key购买 nike

举个简单的例子:

import datatable as dt
import pandas as pd
from datetime import datetime

d_t = dt.Frame(pd.DataFrame({"Date": ["04/05/2020", "04/06/2020"]}))

只有一个名为 Date 的列有两个 str32 类型的值。

如何将日期列转换为数据表框架中的日期格式。

我试过了

dates_list = [datetime.strptime(date, "%m/%d/%Y") for date in d_t["Date"].to_list()[0]]
d_t[:,"NewDate"] = dt.Frame(dates_list)
d_t["NewDate"].max()
# The code can run successfully so far.

但是结果是这样显示的:

     NewDate
▪▪▪▪▪▪▪▪
0 NA

我认为它仍然不是日期格式。

即使我查看了每一列的类型,我仍然不知道:

d_t.stypes

[Out]: (stype.str32, stype.obj64)

有什么办法可以解决这个问题或有什么替代方案吗?

感谢您的回答。

最佳答案

datatable 1.0引入了新的列类型 datatable.Type.date32datatable.Type.time64 .

在这种情况下,从字符串列 Datedate32 类型的转换如下:

d_t[:, dt.update(Date_date = 
dt.time.ymd(dt.as_type(dt.str.slice(dt.f.Date, 6, 10), int),
dt.as_type(dt.str.slice(dt.f.Date, 3, 5), int),
dt.as_type(dt.str.slice(dt.f.Date, 0, 2), int)))]

d_t

Date Date_date
▪▪▪▪ ▪▪▪▪
0 04/05/2020 2020-05-04
1 04/06/2020 2020-06-04

虽然有点冗长,但它在数据表内执行所有操作,没有中间列表或 pandas 框架的开销和惩罚。希望 future 的版本将添加更多功能,而不是datatable.time.ymd()。以简化此类转换操作。

你选了ISO 8601 standard了吗?表示日期(即 %Y-%m-%d 格式的字符串)然后转换为 date32 会简单得多:

d_t = dt.Frame({"Date": ["2020-04-05", "2020-04-06"]})
d_t[0] = dt.Type.date32
d_t.stypes

> (stype.date32,)

关于python - 在python中的数据表框架中将字符串列转换为日期格式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61851512/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com