gpt4 book ai didi

python - 从排序数据框中提取列值的有效方法

转载 作者:太空宇宙 更新时间:2023-11-04 08:26:26 25 4
gpt4 key购买 nike

假设我有一个数据框(按第 1 列排序)df:

column1   column2
1 'Yes'
1 'No'
2 'Yes'
3 'Yes'
3 'Yes'
3 'Yes'

对于第 1 列中的每个值,我想知道它在第 2 列中的可能值,并将这些键值对存储在一个结构中。

例如,给定上面的df,我想要一个像这样的结构

{1: ['yes','No']; 2: ['Yes'], 3:['Yes']}

我做了类似的事情

for key in df[column1].unique.tolist():
values = df.loc[df[column1] == key]][column2].unique().tolist()
dict.add((key, values))

但是由于我原来的df很大,这个方法耗时太长。由于 df 是按 column1 排序的,我想知道是否有更有效的方法来实现这一点。

谢谢!

最佳答案

duplicates去除冗余数据,然后按一列groupby,取唯一值,保存到dict:

final_dict = df.drop_duplicates().groupby('column1')['column2'].unique().to_dict()

关于python - 从排序数据框中提取列值的有效方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56691961/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com