gpt4 book ai didi

python - 将非数值数据应用于神经网络

转载 作者:太空宇宙 更新时间:2023-11-04 04:38:12 25 4
gpt4 key购买 nike

我想在我的神经网络中包含非数字数据。具体来说,我正在查看 GICS 行业分类(例如,公用事业、技术)。我不认为这些数据可以有意义地转换为数字数据。

一种解决方案是使用虚拟变量来标记每个行业。这种方法的局限性在于神经网络输入层中的膨胀维度。是否有更复杂的方法来处理此类问题?

最佳答案

你完全正确,字符串或连续数值 {'utilities': 0, 'technology': 1} 在神经网络中不起作用,因为网络会学习检测不存在的字符或数字之间的关系。

为了避免这种情况,我们使用了一个叫做 One Hot Encoding 的东西.这是一种将每个分类变量编码为状态向量的技术,因此消除了分类值之间存在某种隐含关系的假设。

使用数组 ['Utilities', 'Technology'] 你的一个热编码看起来像:gics = [[1,0],[0,1]]

关于python - 将非数值数据应用于神经网络,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51195939/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com