gpt4 book ai didi

python - 为什么我们必须在深度神经网络中嵌入列,而不是在 tensorflow 的线性分类器中嵌入列?

转载 作者:行者123 更新时间:2023-12-01 02:04:18 24 4
gpt4 key购买 nike

我确实理解 DNN 部分进行转换的原因,因为我们必须将特征转换为数字来馈送到网络。但是,我不明白为什么我们在训练线性分类器时不必这样做?例如,它如何使用由字符组成的列?我是否误解了整件事,或者这背后有什么原因吗?
谢谢

最佳答案

这在某种程度上取决于您正在考虑的分类器,但通常您必须将文本类别转换为某种数字编码才能输入模型

有几种方法可以做到这一点,这里有几个例子:

整数编码

假设您的特征是“体力事件强度”,您的类别为

在这种情况下,我们有序数信息(即它们是有序的),因此保留有关顺序的信息的一种方法是将每个文本类别重新编码为数字。因此,我们可以输入数字:1, 2, 3,而不是输入文本:low,medium, high

One-hot 编码

假设您有一个没有自然顺序的输入变量(即名义变量)。例如,名为“动物”的特征可能包含 catdogsheep

在这里,将类别编码为整数可能不是一个好主意,因为当类别不存在时,您就暗示了类别的排序。

相反,您可以创建 one-hot 向量。每个类别都由一个向量表示,其中 1 表示特定类别的成员资格。当您将“动物”功能输入模型时,您将输入向量而不是文本/单个数字:

cat  =  [1, 0, 0]
dog = [0, 1, 0]
sheep = [0, 0, 1]

关于python - 为什么我们必须在深度神经网络中嵌入列,而不是在 tensorflow 的线性分类器中嵌入列?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49218304/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com