python - 在回归(非分类)问题中使用 softmax 作为隐藏层激活函数是否可以接受？-6ren

python - 在回归(非分类)问题中使用 softmax 作为隐藏层激活函数是否可以接受？

转载作者：行者123 更新时间：2023-12-05 02:02:02

26

4

我之前为 ML 模型做过手动超参数优化，并且总是默认使用 tanh 或 relu 作为隐藏层激活函数。最近，我开始尝试使用 Keras Tuner 来优化我的架构，但不小心将 softmax 作为隐藏层激活的选择。

我只见过 softmax 在输出层的分类模型中使用，从未作为隐藏层激活，尤其是回归。这个模型在预测温度方面确实有很好的性能，但我很难证明使用这个模型是合理的。

我看过类似 this one 的帖子其中讨论了为什么它应该只用于输出，但在我的案例中有什么理由吗？我在下面展示整体架构，以供引用。

model = Sequential()
model.add(Dense(648, activation='relu',input_shape=(train_x.shape[1],)))
model.add(Dropout(0.3))
model.add(LayerNormalization())
model.add(Dense(152,activation='relu'))
model.add(Dropout(0.15))
model.add(LayerNormalization())
model.add(Dense(924,activation='softsign'))
model.add(Dropout(0.37))
model.add(LayerNormalization())
model.add(Dense(248,activation='softmax'))
model.add(Dropout(0.12))
model.add(LayerNormalization())
model.add(Dense(1,activation='linear'))
model.compile(loss='mse',optimizer='Adam')

最佳答案

我可能是错的无论是分类还是回归，应该没有区别。从数学上考虑一下。

一般来说，在隐藏层中使用 softmax 并不是首选，因为我们希望每个神经元都相互独立。如果您应用 softmax 那么它们将是线性相关的，因为激活将强制它们的总和等于 1。不代表没用过，可以引用this paper .

假设使用一些高级激活，例如 LeakyReLU，通过使用它神经元将受到控制，因为可以调整 alpha 率。但是对于 softmax，这是不可能的。

现在回到问题，我认为这取决于数据集。模型能够使用 softmax 概括此数据集。但是我不认为它会一直这样。如上所述，您正在使它们彼此线性相关。因此，如果一个神经元学错了东西，那将影响整个网络的泛化，因为其他值也会受到影响。

编辑:我测试了两个模型。对于某些数据，softmax 的效果与 relu 一样好。但实际情况是所有神经元都相互依赖。让它们相互依赖不是应该冒的风险，尤其是在大型网络中。

数据:

X_train = np.random.randn(10000,20)
y_train = np.random.randn(10000,1)
X_test = np.random.randn(5000,20)
y_test = np.random.randn(5000,1)

使用Softmax:

model = Sequential()
model.add(Dense(512, activation='relu',input_shape=(20,)))
model.add(Dense(256,activation='softmax'))
model.add(Dense(512,activation='softmax'))
model.add(Dense(256,activation='softmax'))
model.add(Dense(128,activation='softmax'))
model.add(Dense(1,activation='linear'))
model.compile(loss='mse',optimizer='adam')
model.fit(X_train, y_train, epochs = 16, validation_data= (X_test, y_test))

结果:模型无法学习此数据。它发散并留在与发散相同的区域。似乎一个神经元想要学习，但另一个不让另一个神经元学习。

Epoch 15/16
313/313 [==============================] - 1s 3ms/step - loss: 1.0259 - val_loss: 1.0269
Epoch 16/16
313/313 [==============================] - 1s 3ms/step - loss: 1.0020 - val_loss: 1.0271

使用relu:

model = Sequential()
model.add(Dense(512, activation='relu',input_shape=(20,)))
model.add(Dense(256,activation='relu'))
model.add(Dense(512,activation='relu'))
model.add(Dense(256,activation='relu'))
model.add(Dense(128,activation='relu'))
model.add(Dense(1,activation='linear'))
model.compile(loss='mse',optimizer='adam')
model.fit(X_train, y_train, epochs = 16, validation_data= (X_test, y_test))

# Obviously overfitting but that's not the case.

结果:使用relu 的模型能够学习这两种数据。

Epoch 15/16
313/313 [==============================] - 1s 3ms/step - loss: 0.5580 - val_loss: 1.3091
Epoch 16/16
313/313 [==============================] - 1s 3ms/step - loss: 0.4808 - val_loss: 1.3290

关于python - 在回归(非分类)问题中使用 softmax 作为隐藏层激活函数是否可以接受？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/66069636/

26

4

0

文章推荐： javascript - 使用 Deno 将 TypeScript 编译成 JavaScript

文章推荐： c++ - 调用堆栈和堆栈有什么区别？

文章推荐： qt - 如何最好地将 std::string_view 转换为 q QString？

jquery - 隐藏、显示、隐藏/显示按钮
代码如下: http://jsfiddle.net/t2nite/KCY8g/ 我正在使用 jquery 创建这些隐藏框。每个框都有一些文本和一个“显示”和“隐藏”按钮。我正在尝试创建一个“显示/隐
jquery - onclick div 隐藏，setTimeout div 隐藏
我正在尝试做某事。如果单击一个添加 #add-conferance 然后菜单将显示.add-contact。当点击隐藏然后它显示隐藏。我也将 setTimeout 设置为 7sec，但我希望当我的鼠标
javascript - 如何仅在第一页(div)隐藏 "previous"按钮并在最后一页(div)隐藏 "next button"
我有一个多步骤(多页？)表单，只要用户按下“下一步”或“上一步”按钮，表单字段就会通过 div 显示和隐藏。我只想禁用第一个 div (div id="page1"class="pageform")
asp.net - 现有 ASP.NET 4 解决方案中的高效 URL 屏蔽/隐藏/隐藏
我有一个使用 IIS 6 和 7 的当前系统，用 ASP.NET 和 .NET 4 中的 C# 编写。 My purpose is to hide the url completely (as per
jquery - 如果 'X' div 可见，则 'Y' div 隐藏。如果 'X' div 隐藏，则 'Y' div 可见
我正在建立一个网站，并有一个幻灯片。幻灯片有标题和索引，覆盖整个页面。当覆盖被激活时，标题需要消失。当覆盖层被停用时，通过单击退出按钮、缩略图链接或菜单链接，字幕必须返回。这就是我目前所拥有的
Jquery显示/隐藏
我正在尝试为显示/隐藏功能制作简单的 jquery 代码。但我仍然做错了什么。 $(document).ready(function(){ $('.arrow').click(function
Android自定义对话框在菜单按下时显示/隐藏
我有一个自定义对话框并使用它来代替 optionMenu。所以我希望 myDialog 表现得像菜单，即在按下菜单时显示/隐藏。我尝试了很多变体，但结果相同: 因为我为 myDialog 设置了一个
Android动态移除tabBar(隐藏)
在我的项目中，我通过 ViewPager 创建我的 tabBar，如下所示: MainActivity.java mViewPager = (ViewPager) findViewById(R.id.
excel - 隐藏/取消隐藏excel中的特定行时要更改的单元格值？
我目前正在使用一个 Excel 表，我将第 1-17 行分组并在单元格 B18 中写入了一个单元格值。我想知道当我在展开/折叠行时单击 +/- 符号时是否有办法更改 B18 中的值。例如:我希望 B
excel - 隐藏/取消隐藏特定组
我想创建一个按钮来使用 VBA 隐藏和取消隐藏特定组。我拥有的代码将隐藏或取消隐藏指定级别中的所有组: Sub Macro1() ActiveSheet.Outline.ShowLevels RowL
excel - 隐藏/取消隐藏最后写入的行
我是 VBA 新手。我想隐藏从任何行到工作表末尾的所有行。我遇到的问题是我不知道如何编程以隐藏最后写入的行。我使用下一个函数知道最后写入的单元格，但我不知道在哪里放置隐藏函数。 last = Ra
acumatica - 隐藏/禁用基于输入字段的其他字段
我想根据另一个字段的条件在 UI 上隐藏或更新一个字段。例如，如果我有一个名为 Color 的字段: [PXUIField(DisplayName="Color")] [PXStringList("
GCC 隐藏/鲜为人知的功能
这是我尝试开始收集通常不会遇到的 GCC 特殊功能。这是@jlebedev 在另一个问题中提到g++的“有效C++”选项之后， -Weffc++ This option warns about C++
Flutter ProgressDialog 隐藏
我开发了一个 Flutter 应用程序，我使用了 ProgressDialog小部件 ( progress_dialog: ^1.2.0 )。首先，我展示了 ProgressDialog小部件和一些代
android - 隐藏/显示没有动画的状态栏
我需要在 API 17+ 的同一个 Activity(Fragment) 中显示/隐藏状态栏。假设一个按钮将隐藏它，另一个按钮将显示它: 节目: getActivity().getWindow().s
angular - 是否可以通过编程方式控制清晰度下拉列表的显示/隐藏？
是否可以通过组件的 ts 代码以编程方式控制下拉列表的显示/隐藏(使用 Angular2 清楚)- https://vmware.github.io/clarity/documentation/dro
jquery - NiceScroll显示/隐藏
我想根据 if 函数的结果隐藏/显示 NiceScroll。在我的html中有三个部分，从左到右逐一滚动。我的脚本如下: var section2 = $('#section2').offset(
jquery - 单击外部 > 隐藏()
我有这个 jquery 代码: $(document).ready(function(){ //global vars var searchBoxes = $(".box"); var searchB
Jquery基于变量显示/隐藏(不是切换)
这个问题已经有答案了: Does something like jQuery.toggle(boolean) exist? (5 个回答) 已关闭 6 年前。在 jQuery 中(我当前使用的是 1
jQuery 隐藏 selectMenu？
我在这样的选择标签上使用 jQuery 的 selectMenu。 $('#ddlReport').selectmenu() 在某些情况下我想隐藏它，但我不知道如何隐藏。这不起作用: $('#ddl

首页

博学

6Ren·AI

商城

python - 在回归(非分类)问题中使用 softmax 作为隐藏层激活函数是否可以接受？