gpt4 book ai didi

python - Pandas/Numpy 根据存在将行移入列

转载 作者:太空宇宙 更新时间:2023-11-03 14:38:00 26 4
gpt4 key购买 nike

我有一个像这样的数据框:

col_a | col b
0 1
0 2
0 3
1 1
1 2

我想把它转换成:

col_a | 1 | 2 | 3
0 1 1 1
1 1 1 0

不幸的是,大多数围绕这个主题的问题/答案只是围绕它

背景:对于 Scikit,我想使用 b 列中存在的值作为属性/特征(类似于一种手动 CountVectorizer,但在这种情况下用于行值而不是文本)

最佳答案

使用get_dummiesindex 创建第一列,最后对每个索引使用 max 以在输出中仅返回 1/0 值:

df = pd.get_dummies(df.set_index('col_a')['col b'], prefix='', prefix_sep='').max(level=0)

print (df)
1 2 3
col_a
0 1 1 1
1 1 1 0

关于python - Pandas/Numpy 根据存在将行移入列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56109392/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com