gpt4 book ai didi

python - Pandas 将带有 unix 时间戳(以毫秒为单位)的行转换为日期时间

转载 作者:IT老高 更新时间:2023-10-28 22:15:02 25 4
gpt4 key购买 nike

我需要处理大量 CSV 文件,其中时间戳始终是一个字符串,以毫秒为单位表示 unix 时间戳。我还没有找到有效修改这些列的方法。

这是我想出的,但是这当然只复制列,我必须以某种方式将其放回原始数据集。我确定在创建 DataFrame 时可以做到吗?

import sys
if sys.version_info[0] < 3:
from StringIO import StringIO
else:
from io import StringIO
import pandas as pd

data = 'RUN,UNIXTIME,VALUE\n1,1447160702320,10\n2,1447160702364,20\n3,1447160722364,42'

df = pd.read_csv(StringIO(data))

convert = lambda x: datetime.datetime.fromtimestamp(x / 1e3)
converted_df = df['UNIXTIME'].apply(convert)

这将选择列“UNIXTIME”并将其更改为

0    1447160702320
1 1447160702364
2 1447160722364
Name: UNIXTIME, dtype: int64

进入这个

0   2015-11-10 14:05:02.320
1 2015-11-10 14:05:02.364
2 2015-11-10 14:05:22.364
Name: UNIXTIME, dtype: datetime64[ns]

但是,我想使用 pd.apply() 之类的东西来获取与转换后的列一起返回的整个数据集,或者正如我已经写过的,只需在从 CSV 生成 DataFrame 时创建日期时间。

最佳答案

您可以使用 to_datetime 将其作为后处理步骤来完成。并传递 arg unit='ms':

In [5]:
df['UNIXTIME'] = pd.to_datetime(df['UNIXTIME'], unit='ms')
df

Out[5]:
RUN UNIXTIME VALUE
0 1 2015-11-10 13:05:02.320 10
1 2 2015-11-10 13:05:02.364 20
2 3 2015-11-10 13:05:22.364 42

关于python - Pandas 将带有 unix 时间戳(以毫秒为单位)的行转换为日期时间,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34883101/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com