gpt4 book ai didi

python - 使用 pandas 读入 csv 文件时有关闭列的问题

转载 作者:太空宇宙 更新时间:2023-11-04 10:19:37 25 4
gpt4 key购买 nike

我知道了。 .csv 文件:

RUN   YR    AP15    PMTE
12008 4.53 0.04
12009 3.17 0.26
12010 6.20 1.38
12011 5.38 3.55
12012 7.32 6.13
12013 4.39 9.40

此处,“YR”列的值为 2008、2009...2013。但是,YR 的值和 RUN 的值之间没有空格。因此,当我尝试读取数据帧时,它没有正确读取 YR 列。

pandas.read_csv('file.csv', skipinitialspace=True, usecols=['YR','PMTE'], sep=' ')

上面一行读取的是 AP15 列而不是 YR。我该如何解决这个问题?

最佳答案

看来您的“csv”确实是一个固定宽度的格式文件。有时这些伴随着另一个文件列出每列的大小,但也许你没有那么幸运,并且必须手动计算列宽。你可以用pandas的定宽阅读功能来阅读这个文件:

df = pd.read_fwf('fixed_width.txt', widths=[4, 4, 8, 8])

In [7]: df
Out[7]:
RUN YR AP15 PMTE
0 1 2008 4.53 0.04
1 1 2009 3.17 0.26
2 1 2010 6.20 1.38
3 1 2011 5.38 3.55
4 1 2012 7.32 6.13
5 1 2013 4.39 9.40

In [8]: df.columns
Out[8]: Index(['RUN', 'YR', 'AP15', 'PMTE'], dtype='object')

有一个选项可以自动查找宽度,但它可能至少需要每列之间有一个空格,因为它在这里似乎不起作用。

关于python - 使用 pandas 读入 csv 文件时有关闭列的问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33073345/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com