gpt4 book ai didi

python - np_utils.to_categorical 的一个热编码问题

转载 作者:太空宇宙 更新时间:2023-11-04 00:06:26 25 4
gpt4 key购买 nike

我正在尝试预测图像语料库的类别。

训练数据的类别在一个包含 4 种值类型的列表中:1,2,4,5

但是 p_utils.to_categorical(theList) 给了我 6 个维度而不是 4 个

你能帮我找出原因吗?

最佳答案

根据 Keras 文档:

to_categorical: Converts a class vector (integers) to the binary class matrix.

Arguments: y: class vector to be converted into a matrix (integers from 0 to num_classes).

to_categorical 的输入参数获取从零开始的整数列表。在您的示例中,列表是 [1, 2, 4, 5],它转换为 6 个不同的类(0 到 5):

[[0. 1. 0. 0. 0. 0.]
[0. 0. 1. 0. 0. 0.]
[0. 0. 0. 0. 1. 0.]
[0. 0. 0. 0. 0. 1.]]

如果你需要相同数量的类,你需要一个转换,它在名为 LabelEncoder 的 sklearn 包中可用。 .它使用 0 到 n_classes-1 之间的值对标签进行编码。因此,如果您将列表 [1, 2, 4, 5] 传递给 LabelEncoder,它会转换为:

from sklearn import preprocessing
le = preprocessing.LabelEncoder()
print(le.fit_transform([1, 2, 4, 5]))
>>> [0 1 2 3]

如您所见,标签从零开始,这是我们to_categorical 方法所需要的。最后一步是将此列表传递给 to_categorical 方法。

new_labels = le.fit_transform([1, 2, 4, 5])
one_hot = to_categorical(new_labels)

>>> [[1. 0. 0. 0.]
[0. 1. 0. 0.]
[0. 0. 1. 0.]
[0. 0. 0. 1.]]

注意:OneHotEncoder也存在于 sklearn 包中,但在这种情况下它也需要 LabelEncoder。

关于python - np_utils.to_categorical 的一个热编码问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53959999/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com