gpt4 book ai didi

python - 选择特定的 CSV 列(过滤)-Python/pandas

转载 作者:太空狗 更新时间:2023-10-29 17:57:58 26 4
gpt4 key购买 nike

我有一个包含 100 列的非常大的 CSV 文件。为了说明我的问题,我将使用一个非常基本的示例。

假设我们有一个 CSV 文件。

in  value   d     f
0 975 f01 5
1 976 F 4
2 977 d4 1
3 978 B6 0
4 979 2C 0

我想选择特定的列。

import pandas
data = pandas.read_csv("ThisFile.csv")

为了选择我使用的前两列

data.ix[:,:2]

为了选择不同的列,例如第 2 列和第 4 列。我该怎么办?

还有另一种方法可以通过重写 CSV 文件来解决此问题。但这是一个巨大的文件;所以我正在避免这种方式。

最佳答案

这将选择第二列和第四列(因为 Python 使用基于 0 的索引):

In [272]: df.iloc[:,(1,3)]
Out[272]:
value f
0 975 5
1 976 4
2 977 1
3 978 0
4 979 0

[5 rows x 2 columns]

df.ix 可以按位置或标签选择。 df.iloc 总是按位置选择。按位置索引时,使用 df.iloc 更明确地表示您的意图。它也快了一点,因为 Pandas 不必检查您的索引是否正在使用标签。


另一种可能性是使用usecols 参数:

data = pandas.read_csv("ThisFile.csv", usecols=[1,3])

这只会将第二列和第四列加载到 data DataFrame 中。

关于python - 选择特定的 CSV 列(过滤)-Python/pandas,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22394598/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com