gpt4 book ai didi

python - 如何在字符级别对句子矩阵进行单热编码?

转载 作者:行者123 更新时间:2023-12-04 02:38:36 25 4
gpt4 key购买 nike

有一个数据框:

    0   1   2   3
0 a c e NaN
1 b d NaN NaN
2 b c NaN NaN
3 a b c d
4 a b NaN NaN
5 b c NaN NaN
6 a b NaN NaN
7 a b c e
8 a b c NaN
9 a c e NaN

我想像这样用one-hot transfrom encode它

    a   c   e   b   d
0 1 1 1 0 0
1 0 0 0 1 1
2 0 1 0 1 0
3 1 1 0 1 1
4 1 0 0 1 0
5 0 1 0 1 0
6 1 0 0 1 0
7 1 1 1 1 0
8 1 1 0 1 0
9 1 1 1 0 0

pd.get_dummies 在这里不起作用,因为它实际上独立地对每一列进行编码。我怎样才能得到这个?顺便说一句,列的顺序并不重要。

最佳答案

试试这个:

df.stack().str.get_dummies().max(level=0)

Out[129]:
a b c d e
0 1 0 1 0 1
1 0 1 0 1 0
2 0 1 1 0 0
3 1 1 1 1 0
4 1 1 0 0 0
5 0 1 1 0 0
6 1 1 0 0 0
7 1 1 1 0 1
8 1 1 1 0 0
9 1 0 1 0 1

关于python - 如何在字符级别对句子矩阵进行单热编码?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60482963/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com