python - MLP 与 Scikitlearn : Artificial Neural Network application for forecast-6ren

python - MLP 与 Scikitlearn : Artificial Neural Network application for forecast

转载作者：行者123 更新时间：2023-12-04 13:10:57

我有交通数据，我想通过向模型显示以下输入来预测下一小时的车辆数量:这一小时的车辆数量和这一小时的平均速度值。这是我的代码:

dataset=pd.read_csv('/content/final - Sayfa5.csv',delimiter=',') 
dataset=dataset[[ 'MINIMUM_SPEED', 'MAXIMUM_SPEED', 'AVERAGE_SPEED','NUMBER_OF_VEHICLES','1_LAG_NO_VEHICLES']]
X = np.array(dataset.iloc[:,1:4])
L = len(dataset)
Y = np.array([dataset.iloc[:,4]])
Y= Y[:,0:L]
Y = np.transpose(Y)

#scaling with MinMaxScaler
scaler = MinMaxScaler()
scaler.fit(X)
X = scaler.transform(X)
 
scaler.fit(Y)
Y = scaler.transform(Y)
print(X,Y)

X_train , X_test, Y_train, Y_test = train_test_split(X,Y,test_size=0.3)
from sklearn.neural_network import MLPRegressor
from sklearn.metrics import mean_squared_error 
mlp = MLPRegressor(activation='logistic')
mlp.fit(X_train,Y_train)
predictions = mlp.predict(X_test)
predictions1=mlp.predict(X_train)
print("mse_test :" ,mean_squared_error(Y_test,predictions), "mse_train :",mean_squared_error(Y_train,predictions1))

我得到了很好的 mse 值，例如 mse_test:0.005467816018933008 mse_train:0.005072774796622158

但我有两点很困惑:

我应该缩放 y 值吗，我读了很多博客写的是不应该缩放 Ys，只缩放 X_train 和 X_test。但是我的 mse 分数很差，比如 49,50,100 甚至更多。
我如何获得对 future 的预测而不是缩放值。例如我写道:

    Xnew=[[ 80 , 40 , 47],
    [ 80 , 30,  81],
    [ 80 , 33, 115]]
    Xnew = scaler.transform(Xnew)
    print("prediction for that input is" , mlp.predict(Xnew))

但我得到了缩放值，例如:该输入的预测是 [0.08533431 0.1402755 0.19497315]

应该是这样的[81,115,102]。

最佳答案

祝贺您使用 [sklearn 的 MLPRegressor][1]，介绍神经网络总是一件好事。

缩放输入数据对于神经网络至关重要。考虑审查 Chapter 11 of Etham Alpaydin's Introduction to Machine Learning . Efficient BackProp paper 中也对此进行了详细说明。 .简而言之，缩放输入数据非常重要，这样您的模型才能学习如何以输出为目标。

在英语中，缩放 在这种情况下意味着将您的数据转换为介于 0 和 1(含)之间的值。不错Stats Exchange post在此描述缩放的差异。对于 MinMax 缩放，您要保持数据的相同分布，包括对异常值敏感。 sklearn 中确实存在更强大的方法(在那篇文章中描述)，例如 RobustScaler .

以这样一个非常基本的数据集为例:

| Feature 1 | Feature 2 | Feature 3 | Feature 4 | Feature 5 | Target |
|:---------:|:---------:|:---------:|:---------:|:---------:|:------:|
|     1     |     17    |     22    |     3     |     3     |   53   |
|     2     |     18    |     24    |     5     |     4     |   54   |
|     1     |     11    |     22    |     2     |     5     |   96   |
|     5     |     20    |     22    |     7     |     5     |   59   |
|     3     |     10    |     26    |     4     |     5     |   66   |
|     5     |     14    |     30    |     1     |     4     |   63   |
|     2     |     17    |     30    |     9     |     5     |   93   |
|     4     |     5     |     27    |     1     |     5     |   91   |
|     3     |     20    |     25    |     7     |     4     |   70   |
|     4     |     19    |     23    |     10    |     4     |   81   |
|     3     |     13    |     8     |     19    |     5     |   14   |
|     9     |     18    |     3     |     67    |     5     |   35   |
|     8     |     12    |     3     |     34    |     7     |   25   |
|     5     |     15    |     6     |     12    |     6     |   33   |
|     2     |     13    |     2     |     4     |     8     |   21   |
|     4     |     13    |     6     |     28    |     5     |   46   |
|     7     |     17    |     7     |     89    |     6     |   21   |
|     4     |     18    |     4     |     11    |     8     |    5   |
|     9     |     19    |     7     |     21    |     5     |   30   |
|     6     |     14    |     6     |     17    |     7     |   73   |

我可以稍微修改一下你的代码来玩这个:

import pandas as pd, numpy as np
from sklearn.neural_network import MLPRegressor
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import RobustScaler
from sklearn.metrics import mean_squared_error 

df = pd.read_clipboard()

# Build data
y = df['Target'].to_numpy()
scaled_y = df['Target'].values.reshape(-1, 1) #returns a numpy array
df.drop('Target', inplace=True, axis=1)
X = df.to_numpy()

#scaling with RobustScaler
scaler = RobustScaler()
X = scaler.fit_transform(X)

# Scaling y just to show you the difference
scaled_y = scaler.fit_transform(scaled_y)

# Set random_state so we can replicate results
X_train , X_test, y_train, y_test = train_test_split(X,y,test_size=0.2, random_state=8)
scaled_X_train , scaled_X_test, scaled_y_train, scaled_y_test = train_test_split(X,scaled_y,test_size=0.2, random_state=8)

mlp = MLPRegressor(activation='logistic')
scaled_mlp = MLPRegressor(activation='logistic')

mlp.fit(X_train, y_train)
scaled_mlp.fit(scaled_X_train, scaled_y_train)

preds = mlp.predict(X_test)
scaled_preds = mlp.predict(scaled_X_test)

for pred, scaled_pred, tar, scaled_tar in zip(preds, scaled_preds, y_test, scaled_y_test):
    print("Regular MLP:")
    print("Prediction: {} | Actual: {} | Error: {}".format(pred, tar, tar-pred))
    
    print()
    print("MLP that was shown scaled labels: ")
    print("Prediction: {} | Actual: {} | Error: {}".format(scaled_pred, scaled_tar, scaled_tar-scaled_pred))

简而言之，缩小目标自然会缩小误差，因为您的模型学习的不是实际值，而是 0 到 1 之间的值。

这就是我们不缩放目标变量的原因，因为我们将值强制放入 0...1 空间，因此误差自然会更小。

关于python - MLP 与 Scikitlearn : Artificial Neural Network application for forecast，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/65359446/

文章推荐： css - Tailwind CSS 更改占位符选项的文本颜色

文章推荐： vba - 将多行的字符串写入文件

文章推荐： macos - 在 OS X 上构建多架构 OpenSSL

文章推荐： applescript - LibreOffice:递归转换文件夹和子文件夹中的文档

artificial-intelligence - 我应该为这个神经网络使用哪个激活函数？
我们正在为跳棋游戏开发神经网络。在我们的训练数据中， 0代表空白单元格，1代表白 block ，-1代表白王，2代表黑 block ，-2代表黑王因此，我们需要的是范围为 [-2, 2] 的激活函数
artificial-intelligence - 什么时候一种启发式比另一种更好？
我回答了一个问题，其中给出了两个启发式算法，要对其进行 A* 以找到从起始状态到目标状态的路径。其中一种启发式方法通过减少一个节点的扩展找到了一条路径 - 现在出于这个原因，我们可以说这种启发式方法
artificial-intelligence - 哪种是编写网络机器人的最佳编程语言？
就目前而言，这个问题不适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the
artificial-intelligence - C中的逻辑编程
我正在尝试用 C 语言实现一些 AI 规划算法，但被基本概念困住了 :) 在跳到主要问题之前，我尝试实现一些支持命题逻辑的小框架: FORMULA f = PROPOSITION(a + 3 > 0)
artificial-intelligence - 决策树是试图最大化信息增益还是熵？
我知道决策树试图将具有高熵的分类器放在决策树上。然而，信息增益如何发挥作用呢？信息增益定义为: InformationGain = EntropyBefore - EntropyAfter 决策树是
artificial-intelligence - 如何应用梳子法？
我正在研究梳子方法，以减少模糊逻辑规则的“组合爆炸”。有一个示例，摘自“Programming Game AI from example”(由 Mat Buckland 撰写): The theory
artificial-intelligence - 我在哪里可以通过真实世界示例获得对所有人工智能技术的非常简单的介绍
我知道人工智能领域非常广阔，有很多关于它的书籍。但我只想知道我可以得到所有人工智能技术的简单介绍的任何资源，例如它希望有 1 或 2 页的介绍所有技术及其示例，说明如何应用它们或将它们用于什么目的。
artificial-intelligence - 当蒙特卡罗树搜索达到内存限制时该怎么办
我最近对游戏中应用的蒙特卡罗树搜索产生了兴趣。我读过几篇论文，但我使用“蒙特卡罗树搜索”Chaslot, G 的博士论文，因为我发现它更容易理解蒙特卡罗树搜索的基础知识我试图对其进行编码，但遇到了
artificial-intelligence - 学习概率图形模型的好资源
我最近开始在 coursera 上学习概率图形模型，开始后 2 周我开始相信我在概率方面不是那么好，因此我什至无法关注第一个主题(贝叶斯网络)。话虽如此，我想努力学习这门类(class)，所以您能否向
artificial-intelligence - 识别数字序列中的模式
我觉得这应该是AI的问题。是否有任何算法可以在给定任何数字序列的情况下找到模式？模式可以是抽象的，因为它可以是... 例如: 12112111211112 ... ( increasing num
artificial-intelligence - 确定神经网络感知器的偏差？
这是我了解神经网络开始的一件事，是我不太了解最初要设置“偏见”的原因吗？我了解Perceptron会根据以下内容计算其输出： P * W + b> 0 然后可以基于b = b + [G-O]计算学习
artificial-intelligence - 连续蛇游戏的神经网络帮助
我正在尝试为“连续蛇”游戏实现 AI。它与普通的蛇游戏非常不同，至少就 AI 而言。基本上，蛇的驾驶方式有点像汽车，两个玩家中第一个撞上他的踪迹或另一个人的踪迹输掉比赛。此外，屏幕环绕其边框。如果您
artificial-intelligence - 什么是启发式函数
有人可以用非常简单的词来解释它是什么。也提供一个例子。因此，例如，如果您必须找到某事物的启发式函数，它应该是什么样子的？以问题为例: 对于水壶问题http://www.math.tamu.edu/~
artificial-intelligence - 在文本中查找相关词的算法
我想要一个词(例如“Apple)并处理一个文本(或者更多)。我想提出相关的术语。例如:处理Apple的文档并发现iPod，iPhone，Mac是与“苹果”相关的术语。关于如何解决这个问题的任何想法？
artificial-intelligence - 用于人脑模拟的开源软件
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。想改善这个问题吗？更新问题，使其成为 on-topic对于堆栈溢出。 6年前关闭。 Improve thi
artificial-intelligence - 马尔可夫决策过程问题
关闭。这个问题需要debugging details .它目前不接受答案。想改善这个问题吗？更新问题，使其成为 on-topic对于堆栈溢出。 7年前关闭。 Improve this questio
artificial-intelligence - 权重初始化
我计划将 Nguyen-Widrow 算法用于具有的 NN多个隐藏层 .在研究的过程中，我发现了很多歧义，我想澄清一下。以下是 Nguyen-Widrow 算法的伪代码 Initial
artificial-intelligence - 有没有积极的强化学习竞赛？
我喜欢在强化学习方面做兼职研究。近年来(截至2009年)在rl-competition.org举办了强化学习竞赛。有一些非常有趣的问题，但这似乎已停止。我很想提高我的技能和知识，并与该领域的其他爱好者
artificial-intelligence - 如何确定在人工神经网络的层之间连接哪些神经元？
假设我的第一个输入层有 10 个输入节点/神经元。假设我的隐藏层也有 10 个神经元。我的第三层也是最后一层是一个输出神经元。如何连接层？有没有一种技术可以确定最好的方法来做到这一点，还是只是将每个
artificial-intelligence - 蒙特卡罗和马尔可夫链技术有什么区别？
我想开发 RISK 棋盘游戏，其中包括面向计算机玩家的 AI。另外，我看了两篇文章，this和 this ，关于它，我意识到我必须学习蒙特卡罗模拟和马尔可夫链技术。我认为我必须一起使用这些技术，但我想

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - MLP 与 Scikitlearn : Artificial Neural Network application for forecast