gpt4 book ai didi

python - python/pandas read_csv 中的前导逗号

转载 作者:太空宇宙 更新时间:2023-11-04 00:50:16 24 4
gpt4 key购买 nike

我有一个 csv 文件,我想将其加载到 pandas 中,但格式设置给我带来了一些问题。文件是这样的:

Version 1

,Date Time,Name,Value

,26/Jan/2016 07:35:52,Name1,340rqi

,26/Jan/2016 07:00:00,Name2,1.00E+005

,26/Jan/2016 07:00:00,Name3,pulled_9

(这是一团糟的文件,但要点是第 1 列为空,第 1 行为空,位置 0,0 处只有“版本 1”)

我正在使用以下代码将其放入我的 DF 中:

filename_cv = '123456789.csv'
sheet_cv = filename_cv[:-4] #trimming off the .csv part
df_cv = pandas.read_csv(filename_cv, sheet_cv,engine='python')

但是输出并不理想。这是我得到的:

df_cv

Out[4]:

Version 1

0 ,26/Jan/2016 07:35:52,Name1,340rqi

1 ,26/Jan/2016 07:00:00,Name2,1.00E+005

2 ,26/Jan/2016 07:00:00,Name3,pulled_9

我认为那些前导逗号是我的问题,但是否有摆脱它们的好方法?

我知道我可以修剪行并更改索引 (skiprows),但我确信那些前导逗号是我的问题的根源。

我希望逗号分隔值像往常一样进入它们自己的列。

怎么了?

最佳答案

试试这个:

In [313]: df = pd.read_csv('/path/to/file.csv', skiprows=1)

In [314]: df
Out[314]:
Unnamed: 0 Date Time Name Value
0 NaN 26/Jan/2016 07:35:52 Name1 340rqi
1 NaN 26/Jan/2016 07:00:00 Name2 1.00E+005
2 NaN 26/Jan/2016 07:00:00 Name3 pulled_9

In [315]: df = df.drop(df.columns[0], axis=1)

In [316]: df
Out[316]:
Date Time Name Value
0 26/Jan/2016 07:35:52 Name1 340rqi
1 26/Jan/2016 07:00:00 Name2 1.00E+005
2 26/Jan/2016 07:00:00 Name3 pulled_9

如果你想解析你的日期时间列,使用这个:

df = pd.read_csv(io.StringIO(data), skiprows=1, parse_dates=['Date Time'])

关于python - python/pandas read_csv 中的前导逗号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37442993/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com