gpt4 book ai didi

python Pandas : How to create a binary matrix from column of lists?

转载 作者:太空宇宙 更新时间:2023-11-04 08:49:54 24 4
gpt4 key购买 nike

我有一个如下所示的 Python Pandas DataFrame:

      1
0 a, b
1 c
2 d
3 e

a, b 是表示用户特征列表的字符串

如何将其转换为用户特征的二进制矩阵,如下所示:

     a    b    c    d    e
0 1 1 0 0 0
1 0 0 1 0 0
2 0 0 0 1 0
3 0 0 0 0 1

我看到一个类似的问题Creating boolean matrix from one column with pandas但该列不包含列表条目。

我已经尝试过这些方法,有没有办法将两者合并:

pd.get_dummies()

pd.get_dummies(df[1])


a, b c d e
0 1 0 0 0
1 0 1 0 0
2 0 0 1 0
3 0 0 0 1

df[1].apply(lambda x: pd.Series(x.split()))

      1
0 a, b
1 c
2 d
3 e

也对创建这种类型的二进制矩阵的不同方法感兴趣!

感谢任何帮助!

谢谢

最佳答案

我认为你可以使用:

df = df.iloc[:,0].str.split(', ', expand=True)
.stack()
.reset_index(drop=True)
.str.get_dummies()

print df
a b c d e
0 1 0 0 0 0
1 0 1 0 0 0
2 0 0 1 0 0
3 0 0 0 1 0
4 0 0 0 0 1

编辑:

print df.iloc[:,0].str.replace(' ','').str.get_dummies(sep=',')
a b c d e
0 1 1 0 0 0
1 0 0 1 0 0
2 0 0 0 1 0
3 0 0 0 0 1

关于 python Pandas : How to create a binary matrix from column of lists?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36487842/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com