gpt4 book ai didi

python - 在日期时间字段中按小时对 NumPy 数组进行分箱

转载 作者:太空宇宙 更新时间:2023-11-03 17:32:30 25 4
gpt4 key购买 nike

我一直在Python中努力解决如何根据包含日期和时间的字段中的小时对csv中的记录进行分组。该文件包含大约 1,000,000 条记录。我已将文件读入 Pandas 数据帧并创建了一个二维 NumPy 数组,以便每个记录都是 NumPy 数组中的子列表,例如:

#this is a NumPy array
npdata = ([somedata, '2014-07-01 08:18:21', somedata, somedata, somedata, somedata, etc],
[somedata, '2014-07-01 10:01:40', somedata, somedata, somedata, somedata, etc], etc...])

日期和时间是一个字符串,在每个子列表中始终位于相同位置 (1)。我创建了变量“hourlist”,它是 24 个空子列表的列表。我想迭代“npdata”,以使用 npdata 中在日期和时间字段中包含相同小时的子列表子集填充“hourlist”中的 24 个子列表中的每一个。例如。日期时间为 00:xx:xx 的所有“npdata”子列表将位于“hourlist”的一个子列表中,所有 01:xx:xx 位于另一个子列表中,所有 02:00:00 位于另一个子列表中,等等,从 0 到 23 小时。我一直试图解决这个问题,但总是碰壁。根据一些 Google 搜索,我认为应该使用 datetime.strptime() 类方法作为解决方案的一部分,但我不明白如何使用。

我真的很感谢任何提示/建议。

最佳答案

给定时间字符串的格式,小时始终位于字符串的位置 [11:13],并且始终为整数。

因此,只需编写一个函数来获取该整数并将其用作索引,如下所示:

def get_hour(in_array):
return int(in_array[1][11:13])

for x in npdata:
hourlist[get_hour(x)].append(x)

关于python - 在日期时间字段中按小时对 NumPy 数组进行分箱,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31689334/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com