gpt4 book ai didi

python - pandas dataframe,唯一化一列

转载 作者:太空宇宙 更新时间:2023-11-03 17:23:00 26 4
gpt4 key购买 nike

我有一个包含两列的 pandas 数据框。示例:

index       result
LI00066994 0.740688
LI00066994 0.742431
LI00066994 0.741826
LI00066994 0.741328
LI00066994 0.741826
LI00066994 0.741328
LI00073078 0.741121
LI00073078 0.752619
LI00073078 0.757116
LI00073078 0.752619
LI00073078 0.757116
LI00073078 0.752619

现在我想要一个数据框,其中我的索引是唯一的,同时保留所有相应的结果 - 它们应该位于不同的列中(结果 1、结果 2、结果 3 ...)。

期望的输出:

index       result1   result2  result3  result4  result5  result6
LI00066994 0.740688 0.742431 0.741826 0.741328 0.741826 0.741328
LI00073078 0.741121 0.752619 0.757116 0.752619 0.757116 0.752619

有人知道如何做到这一点吗?

最佳答案

你可以这样做:

d = """index       result
LI00066994 0.740688
LI00066994 0.742431
LI00066994 0.741826
LI00066994 0.741328
LI00066994 0.741826
LI00066994 0.741328
LI00073078 0.741121
LI00073078 0.752619
LI00073078 0.757116
LI00073078 0.752619
LI00073078 0.757116
LI00073078 0.752619
LI00073078 0.752620"""

df = pd.read_csv(pd.core.common.StringIO(d), sep='\s+')

df_out = pd.concat([pd.DataFrame({name: df_['result'].values}).T for name, df_ in df.groupby('index')])
df_out = df_out.rename(columns=lambda x: 'result' + str(x))
df_out = df_out.reset_index()
print df_out

产量:

        index  result0  result1  result2  result3  result4  result5  result6  
0 LI00066994 0.741 0.742 0.742 0.741 0.742 0.741 NaN
1 LI00073078 0.741 0.753 0.757 0.753 0.757 0.753 0.753

关于python - pandas dataframe,唯一化一列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32931816/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com