gpt4 book ai didi

python - 使用 usecols 时 Pandas 保留索引列

转载 作者:太空狗 更新时间:2023-10-30 01:22:51 26 4
gpt4 key购买 nike

这是我的问题的重新措辞版本,希望更有意义:

当使用带有隐式索引的 read_csv 时(即文件中的第一列没有标题),一切正常,我得到一个数据帧,其索引是文件中的第一列 -隐式索引列。

但是,如果我将 usecols 指定为 read_csv 的参数,隐式索引列将被忽略,并且返回的数据帧具有由 pandas (0, 1) 创建的标准索引, 2, 3 等)。

我不能显式地为 usecols 传递列表中的索引列,然后指定 index_col 参数,因为隐式索引列没有标题(pandas 就是这么知道的是隐式索引)!

有什么办法解决这个问题吗?

这是原始问题:

我正在尝试读取一个 csv 文件,其中有一列未命名的行索引,其余列已命名:

       |head1|head2|
index1 | data1 | data2 |

当我用 usecols 读取一定数量的列时,我还想包括行索引。但是,由于这些未命名,我无法在 usecols 列表中包含该字符串。

我试过结合使用整数索引和字符串(例如 usecols = [0, 'header1', 'header2'] 但这似乎不起作用。
如果我简单地将 ind_col 指定为 0,它将使用我选择的第一列作为索引列。

那么,如何在保留文件中第一个无名列作为我的行索引的同时读取名称列选择(通过 usecols)?

最佳答案

我最近遇到了同样的问题,并且能够使用 pandas 默认的未命名方法解决它。

data = pd.read_csv('advertising.csv', header=0, index_col=[0] , usecols=['Unnamed: 0', 'radio','sales'])

关于python - 使用 usecols 时 Pandas 保留索引列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18739510/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com