gpt4 book ai didi

machine-learning - 当标签维度太大并且想要寻找另一种方式而不是one-hot编码时

转载 作者:行者123 更新时间:2023-11-30 10:00:15 27 4
gpt4 key购买 nike

我是一名学习机器学习的初学者。

我尝试制作一些模型(FNN),但该模型的输出标签太多,无法使用 one-hot 编码。

你能帮我吗?

我想解决这个问题:标签数据适用于水果:

类型(苹果、葡萄、桃子)、质量(好、一般、差)、价格(贵、一般、便宜)、尺寸(大、一般、小)

所以,如果我进行one-hot编码,数据大小可达3*3*3*3, 81

我认为标签数据看起来像 4 个 one-hot-encoding 序列数据。

有没有办法让标注数据成为小维数据,而不是81维一热编码?

我认为也可以使用二进制编码,但认识到在神经网络中使用二进制编码有一些缺点。

谢谢:D

最佳答案

如果您对 4 个变量进行热编码,您将拥有 3+3+3+3=12 个变量,而不是 81 个。

这个概念是,您需要为分类特征中的每个类别创建一个二元变量,而不是为四个特征中的每种可能的类别组合创建一个二元变量。

尽管如此,其他可能的方法是数字编码、二进制编码(如您所提到的)或频率编码(更改每个类别及其在数据集中的频率)。结果通常取决于问题,因此请尝试不同的方法,看看哪种方法最适合您!

关于machine-learning - 当标签维度太大并且想要寻找另一种方式而不是one-hot编码时,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59317124/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com