gpt4 book ai didi

python - 按列变量拆分 Pandas 数据框

转载 作者:太空宇宙 更新时间:2023-11-04 08:47:26 26 4
gpt4 key购买 nike

我有一个数据框,我想按列变量拆分,如下例所示:

gender height weight
male 42.8 157.5
male 41.3 165.6
female 48.4 144.2

我想要的结果是:

df_male

gender height weight
male 42.8 157.5
male 41.3 165.6

df_female

gender  height  weight
female 48.4 144.2

关键是我想成为 能够使用具有 5-25 个类别的变量来执行此操作。

我的想法是应该有一种方法可以遍历原始数据帧并吐出多个数据帧,但我对所有可能的解决方案持开放态度

最佳答案

以下将为 gender 列的每个值生成一个包含一个数据框的列表:

import io
import pandas as pd

data = io.StringIO('''\
gender height weight
male 42.8 157.5
male 41.3 165.6
female 48.4 144.2
''')
df = pd.read_csv(data, delim_whitespace=True)

dfs = [rows for _, rows in df.groupby('gender')]

dfs 是一个长度为 2 的列表,包含以下元素:

print(dfs[0])

# gender height weight
# 2 female 48.4 144.2

print(dfs[1])

# gender height weight
# 0 male 42.8 157.5
# 1 male 41.3 165.6

gender 列中的不同值和数据帧的值创建一个字典可能会更好:

dfs = [{gender: rows for gender, rows in df.groupby('gender')}

以下字典中的结果:

{'female':     gender  height  weight
2 female 48.4 144.2,
'male': gender height weight
0 male 42.8 157.5
1 male 41.3 165.6}

关于python - 按列变量拆分 Pandas 数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38962634/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com