gpt4 book ai didi

python - 将两列数据框转换为 Pandas 中的出现矩阵

转载 作者:太空狗 更新时间:2023-10-30 01:46:23 25 4
gpt4 key购买 nike

大家好,我有一个 csv 文件,其中包含以下格式的数据

A   a
A b
B f
B g
B e
B h
C d
C e
C f

第一列包含项目第二列包含来自特征向量的可用特征=[a,b,c,d,e,f,g,h]我想将其转换为如下所示的出现矩阵

    a,b,c,d,e,f,g,h
A 1,1,0,0,0,0,0,0
B 0,0,0,0,1,1,1,1
C 0,0,0,1,1,1,0,0

谁能告诉我如何使用 pandas 做到这一点?

最佳答案

这是使用 pd.get_dummies() 的另一种方法。

import pandas as pd

# your data
# =======================
df

col1 col2
0 A a
1 A b
2 B f
3 B g
4 B e
5 B h
6 C d
7 C e
8 C f

# processing
# ===================================
pd.get_dummies(df.col2).groupby(df.col1).apply(max)

a b d e f g h
col1
A 1 1 0 0 0 0 0
B 0 0 0 1 1 1 1
C 0 0 1 1 1 0 0

关于python - 将两列数据框转换为 Pandas 中的出现矩阵,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31518937/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com