gpt4 book ai didi

python - 从 List 中提取值到 Pandas DF

转载 作者:行者123 更新时间:2023-11-30 22:15:59 25 4
gpt4 key购买 nike

我有一个 python 列表如下,

list_fs = ['drwxrwx---   - uname 0 2017-08-25 12:10 hdfs://filepath=2011-01-31 16%3A06%3A09.0',
'drwxrwx--- - uname 0 2017-08-29 14:12 hdfs://filepath=2011-02-28 10%3A00%3A00',
'drwxrwx--- - uname 0 2017-08-29 14:20 hdfs://filepath=2011-03-31 10%3A00%3A00',
'drwxrwx--- - uname 0 2017-08-29 14:32 hdfs://filepath=2011-04-30 10%3A00%3A00',
'drwxrwx--- - uname 0 2018-02-20 13:57 hdfs://filepath=2011-05-31 08%3A00%3A00',
'drwxrwx--- - uname 0 2017-08-29 15:02 hdfs://filepath=2011-05-31 10%3A00%3A00',
'drwxrwx--- - uname 0 2017-08-29 15:06 hdfs://filepath=2011-06-30 10%3A00%3A00',
'drwxrwx--- - uname 0 2017-08-31 10:38 hdfs://filepath=2011-07-31 10%3A00%3A00',
'drwxrwx--- - uname 0 2017-08-31 10:42 hdfs://filepath=2011-08-31 10%3A00%3A00',
'drwxrwx--- - uname 0 2017-08-31 11:08 hdfs://filepath=2011-09-30 10%3A00%3A00',
'drwxrwx--- - uname 0 2017-08-31 11:11 hdfs://filepath=2011-10-31 10%3A00%3A00',
'drwxrwx--- - uname 0 2017-08-31 11:15 hdfs://filepath=2011-11-30 10%3A00%3A00',
'drwxrwx--- - uname 0 2017-08-31 11:16 hdfs://filepath=2011-12-31 10%3A00%3A00']

我需要将时间戳和文件路径提取到 pandas 数据框中。时间戳列需要采用时间戳数据类型并且如下。

enter image description here

最好的方法是什么?

最佳答案

import pandas as pd

df = pd.DataFrame(list_fs)

df['Timestamp_ordered'] = [re.findall('\d+-\d+-\d+ \d+:\d+',i)[0] for i in list_fs]
df['FilePath'] = [re.findall('hdfs:.*', i)[0] for i in list_fs]

df = df[['Timestamp_ordered', 'FilePath']].sort_values('Timestamp_ordered')

关于python - 从 List 中提取值到 Pandas DF,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50100941/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com