gpt4 book ai didi

python - label_binarize 类而不丢失索引号

转载 作者:行者123 更新时间:2023-12-05 05:58:02 26 4
gpt4 key购买 nike

我试图在不丢失索引号的情况下对目标类进行二值化。但是失败了,在sklearn.preprocessing.label_binarize中找不到对应的选项。输入 y:

index  target
1 0
3 0
21 1
50 1

代码:

y=data['target']
y=label_binarize(y, classes=[0, 1])
y=np.hstack((1-y, y))

输出:

    0    1
0 1 0
1 1 0
2 0 1
3 0 1

我喜欢的输出

    0    1
1 1 0
3 1 0
21 0 1
50 0 1

最佳答案

Scikit-Learn 函数接受 Pandas 数据帧作为输入,但它们返回 numpy 数组作为结果。在使用数据框时,您应该考虑这条规则。

因此 y 是一个 numpy 数组。但是你可以像这样再次使它成为数据框:

y = pd.DataFrame(y, index=data.index)  # make it dataframe, and pass data indices
y.head()

现在,y 是:

    0   1
1 1 0
3 1 0
21 0 1
50 0 1

关于python - label_binarize 类而不丢失索引号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/68626523/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com