gpt4 book ai didi

python - 如何在 one-hot 编码的 pandas 数据框中找到列的正索引?

转载 作者:太空宇宙 更新时间:2023-11-03 21:25:03 30 4
gpt4 key购买 nike

我有一个单热编码的 pandas 数据帧,其形式为:

df

      A      B      C      D
ID
#1 2 1 0 1
#2 1 0 0 1
#3 1 1 1 0

df = pd.DataFrame({'ID_1':['#1','#1','#3','#1'], 'ID_2':['#2','#3',np.NaN,'#2'], \
'ID_3':['#3', np.NaN, np.NaN, np.NaN] }, index=['A','B','C','D'])

我想将其转换为一个新的数据帧,其中索引是列,值对应于旧索引(一种旋转数据帧的方式)。我只是寻找那些在原始数据框中具有正值(对应于计数)的旧索引。实际上,df 应该如下所示:

new_df

      ID_1  ID_2   ID_3
c_id
A #1 #2 #3
B #1 #3
C #3
D #1 #2

我知道我需要以某种方式旋转数据框,但我无法找到有效的方法来做到这一点。

最佳答案

首先使用 gt 使 df 变为 bool 值,然后使用 mul ,然后我们按 isnull 或 not 对您的列进行排序。

df.gt(0).mul(df.index.values,0).T.replace('',np.nan).apply(lambda x : sorted(x,key=pd.isnull),1)
ID #1 #2 #3
A #1 #2 #3
B #1 #3 NaN
C #3 NaN NaN
D #1 #2 NaN

关于python - 如何在 one-hot 编码的 pandas 数据框中找到列的正索引?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53908365/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com