gpt4 book ai didi

python - 按名称列表对 Pandas 中的多个列进行切片

转载 作者:太空狗 更新时间:2023-10-29 22:10:36 25 4
gpt4 key购买 nike

我正在尝试以两种不同的方法在 Pandas 数据框中选择多个列:

1) 通过列号,例如,第 1-3 列和第 6 列以后。

2) 通过列名列表,例如:

years = list(range(2000,2017))
months = list(range(1,13))
years_month = list(["A", "B", "B"])
for y in years:
for m in months:
y_m = str(y) + "-" + str(m)
years_month.append(y_m)

然后,years_month 将产生以下内容:

['A',
'B',
'C',
'2000-1',
'2000-2',
'2000-3',
'2000-4',
'2000-5',
'2000-6',
'2000-7',
'2000-8',
'2000-9',
'2000-10',
'2000-11',
'2000-12',
'2001-1',
'2001-2',
'2001-3',
'2001-4',
'2001-5',
'2001-6',
'2001-7',
'2001-8',
'2001-9',
'2001-10',
'2001-11',
'2001-12']

也就是说,在两种方法中仅加载名称在列表 years_month 中的列的最佳(或正确)方法是什么?

最佳答案

我想你需要numpy.r_对于列的连接位置,然后使用 iloc选择:

print (df.iloc[:, np.r_[1:3, 6:len(df.columns)]])

对于 list 的第二种方法子集:

print (df[years_month])

示例:

df = pd.DataFrame({'2000-1':[1,3,5],
'2000-2':[5,3,6],
'2000-3':[7,8,9],
'2000-4':[1,3,5],
'2000-5':[5,3,6],
'2000-6':[7,8,9],
'2000-7':[1,3,5],
'2000-8':[5,3,6],
'2000-9':[7,4,3],
'A':[1,2,3],
'B':[4,5,6],
'C':[7,8,9]})

print (df)
2000-1 2000-2 2000-3 2000-4 2000-5 2000-6 2000-7 2000-8 2000-9 A \
0 1 5 7 1 5 7 1 5 7 1
1 3 3 8 3 3 8 3 3 4 2
2 5 6 9 5 6 9 5 6 3 3

B C
0 4 7
1 5 8
2 6 9

print (df.iloc[:, np.r_[1:3, 6:len(df.columns)]])
2000-2 2000-3 2000-7 2000-8 2000-9 A B C
0 5 7 1 5 7 1 4 7
1 3 8 3 3 4 2 5 8
2 6 9 5 6 3 3 6 9

您还可以求和 ranges(在 python 3 中转换为 list 是必要的):

rng = list(range(1,3)) + list(range(6, len(df.columns)))
print (rng)
[1, 2, 6, 7, 8, 9, 10, 11]

print (df.iloc[:, rng])
2000-2 2000-3 2000-7 2000-8 2000-9 A B C
0 5 7 1 5 7 1 4 7
1 3 8 3 3 4 2 5 8
2 6 9 5 6 3 3 6 9

关于python - 按名称列表对 Pandas 中的多个列进行切片,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40698043/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com