gpt4 book ai didi

machine-learning - 如何仅使用一个样本对值进行标准化?

转载 作者:行者123 更新时间:2023-11-30 08:35:24 24 4
gpt4 key购买 nike

我正在使用人工神经网络进行时间序列温度预测的研究,并且大多数引用文献在使用最小-最大归一化技术将输入值输入神经网络之前对输入值进行归一化。训练和测试数据集均已标准化。输入值为特定日期的温度、露点、降水量、压力和风速值。

如果我的测试集中只有一个样本(例如,我只有今天的天气属性来预测明天的温度),如何标准化这些值,因为我将具有相同的最小值和最大值每个属性的值?

附注我已经给我所使用的研究的作者发了电子邮件,但他们都没有回复,所以我想我应该在这里寻求帮助:)

最佳答案

相同的方式对训练集和测试集执行归一化,因此您可以计算训练集上的“边界”,并且仅将其应用于测试集(您不应使用测试数据计算这些界限,因为您应该假设在创建模型时您不知道测试数据)。

您似乎在这里缺少机器学习的核心思想。您无法在一个样本上训练预测模型。我们所说的样本数量是指您收集的一组观测值的大小,而不是输入模型的数据量(因此,当您根据今天预测明天的温度时,并不意味着您有一个样本,您需要 从历史中获得大量样本,以便训练任何模型,特别是神经网络)。

因此,归一化问题在这里并不重要 - 因为您只需对整个历史集进行归一化或者,如果您知道每个属性可以值的确切边界,您可以手动对它们进行归一化(例如 - 您正在以摄氏度测量温度,因此如果您生活在世界“较软”的地区,它应该落入 [-20,40] 区间或较小的区间)。

关于machine-learning - 如何仅使用一个样本对值进行标准化?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19476064/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com