gpt4 book ai didi

python - pd.read_csv 忽略没有标题的列

转载 作者:太空宇宙 更新时间:2023-11-03 14:59:19 24 4
gpt4 key购买 nike

我有一个由第三方程序生成的 .csv 文件。文件中的数据格式如下:

%m/%d/%Y    49.78   85  6   15                      
03/01/1984 6.63368 82 7 9.8 34.29056405 2.79984079 2.110346498 0.014652412 2.304545521 0.004732732
03/02/1984 6.53368 68 0 0.2 44.61471002 3.21623666 2.990408898 0.077444779 2.793385466 0.02661873
03/03/1984 4.388344 55 6 0 61.14463457 3.637231063 3.484310818 0.593098236 3.224973641 0.214360796

有 5 个列标题(Excel 中的第 1 行,A-E 列)但总共有 11 列(第 1 行 F-K 列为空,第 2-N 行包含 A-K 列的浮点值)

我不确定如何粘贴 .csv 行以便于复制它们,对此深表歉意。此处显示了 Excel 工作表的图像:Excel sheet to read in

当我使用下面的代码时:

FWInds=pd.read_csv("path.csv")

或:

FWInds=pd.read_csv("path.csv", header=None)

生成的数据框 FWInds 不包含最后 6 列 - 它只包含带有标题的列(excel 中的 A-E 列,A 列作为索引值)。

FWIDat.shape
Out[48]: (245, 4)

最后 6 列是我唯一想读的内容。

我也试过:

FWInds=pd.read_csv('path,csv', header=None, index_col=False)

但出现如下错误

CParserError: Error tokenizing data. C error: Expected 5 fields in line 2, saw 11

我还试图忽略第一行,因为列标题不重要:

FWInds=pd.read_csv('path.csv', header=None, skiprows=0)

但得到同样的错误。

“usecols”参数也没有运气,它似乎不明白我指的是列号(不是名称),除非我做错了:

FWInds=pd.read_csv('path.csv', header=None, usecols=[5,6,7,8,9,10])

有什么建议吗?我确信这是一个简单的修复,但我对 python 还很陌生。

最佳答案

有几个参数可以传递给 pd.read_csv():

import pandas as pd
colnames = list('ABCDEFGHIKL')
df = pd.read_csv('test.csv', sep='\t', names=colnames)

有了这个,我实际上可以很好地导入您的数据(之后可以通过例如 df['K'] 访问它)。

关于python - pd.read_csv 忽略没有标题的列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39621914/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com