gpt4 book ai didi

python - 从 n m 列数据帧创建 m n 列数据帧

转载 作者:行者123 更新时间:2023-12-01 07:28:20 31 4
gpt4 key购买 nike

将 m n 列数据帧的列表转换为 n m 列数据帧的列表的最简洁方法是什么?具体来说,我希望第一个 n 列数据帧包含 m 列数据帧中的所有第一列,第二个 n 列数据帧包含 m 列数据帧中的所有第二列,依此类推。同时,我想为这些列分配新名称。

m, n = 3, 2
dfs = [
pd.DataFrame(pd.np.random.randint(1, 10, (4, m)), columns=["a", "b", "c"])
for _ in range(n)
]
# dfi1
a b c
0 2 7 9
1 9 4 3
2 1 6 1
3 7 7 2
# dfi2
a b c
0 5 6 2
1 8 7 1
2 2 8 5
3 9 6 1

目标:

# dfo1
foo bar
0 2 5
1 9 8
2 1 2
3 7 9
# dfo2
foo bar
0 7 6
1 4 7
2 6 8
3 7 6
# dfo3
foo bar
0 9 2
1 3 1
2 1 5
3 2 1

可能有比两个冗长的嵌套 for 循环更好的方法吗?

最佳答案

简短回答:

df1 = pd.concat(dfs, keys=('foo','bar')).unstack(0)
dfs1 = [df1.xs(i, axis=1, level=0) for i in df1.columns.levels[0]]
# or
dfs1 = [df.droplevel(0, axis=1) for i, df in df1.groupby(axis=1, level=0)]

一步一步

np.random.seed(2019)
m, n = 3, 2
dfs = [
pd.DataFrame(pd.np.random.randint(1, 10, (4, m)), columns=["a", "b", "c"])
for _ in range(n)
]
print (dfs)
[ a b c
0 9 3 6
1 9 7 9
2 1 1 8
3 9 6 4, a b c
0 1 3 6
1 8 9 6
2 5 1 2
3 7 1 3]

首次使用concat键参数由具有相同大小的元组列表组成,例如 n 的长度,然后使用 DataFrame.unstack用于对列中的 MultiIndex 进行 reshape :

df1 = pd.concat(dfs, keys=('foo','bar')).unstack(0)
print (df1)
a b c
foo bar foo bar foo bar
0 9 1 3 3 6 6
1 9 8 7 9 9 6
2 1 5 1 1 8 2
3 9 7 6 1 4 3

然后创建DataFrame列表:

dfs1 = [df1.xs(i, axis=1, level=0) for i in df1.columns.levels[0]]
print (dfs1)
[ foo bar
0 9 1
1 9 8
2 1 5
3 9 7, foo bar
0 3 3
1 7 9
2 1 1
3 6 1, foo bar
0 6 6
1 9 6
2 8 2
3 4 3]

或者:

dfs1 = [df.droplevel(0, axis=1) for i, df in df1.groupby(axis=1, level=0)]
print (dfs1)
[ foo bar
0 9 1
1 9 8
2 1 5
3 9 7, foo bar
0 3 3
1 7 9
2 1 1
3 6 1, foo bar
0 6 6
1 9 6
2 8 2
3 4 3]

关于python - 从 n m 列数据帧创建 m n 列数据帧,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57338964/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com