machine-learning - 关于神经网络权重向量的一般查询-6ren

machine-learning - 关于神经网络权重向量的一般查询

转载作者：行者123 更新时间：2023-11-30 09:10:40

25

4

我试图更好地理解机器学习原理，但我有点困惑于一切如何联系在一起。

例如，我的任务是对一组三种模式进行分类。每个模式都有一个与之关联的目标值(为简单起见，例如 1、0 和 -1)。我把算法通过了LMS算法。

我计算了输出和错误:

a = w(n) * x(n)    
e(n) = d(n) - w(n)x(n)

然后我重新计算了权重向量:

w(n+1) = w(n) + alpha*x(n)*e(n)

我对所有三种模式都这样做了。我迭代了权重向量的重新计算大约 30 次。

现在，我该如何处理我创建的这个新权重向量？我是否将此权重向量应用于一组新的“测试数据”？

“收敛”权重向量现在是否成为尝试对任何未见数据进行分类的权重向量？

有了这个权重向量，如何将其应用到新的数据集？梯度下降、均方误差和收敛在哪里适合这个？

最佳答案

正如 Matias 提到的，这不是一个神经网络 --- LMS(我假设在这里代表最小均方)与线性回归等线性方法更密切相关。相比之下，神经网络模型类通常由多个节点排列成电路形式的模型组成，将输入数据经过多层变换，从而最终结果通常是输入的非常复杂的非线性函数。

话虽如此:您的更新步骤需要在某处涉及梯度才能发挥作用。你写的

w(n+1) = w(n) + alpha*x(n)*e(n)

我将其重写为

new_weight = curr_weight + learning_rate * gradient

哪里

gradient = X * transpose(e)

误差向量和输入数据向量的点积。

至于为什么我决定称之为“渐变”，请参阅derivation这个更新规则的——更新规则来自于由均方误差给出的成本函数的梯度下降。经过“足够”的迭代后，您拥有的权重将是最小化均方误差的权重，因此得名。

Now, what do I do with this new weight vector that I have created? Do I apply this weight vector to a new set of "testing data"? Does the "converged" weight vector now become the weight vector to try and classify any unseen data?

是的，完全正确!让我们将最终的权重集称为 final_weights 并假设它有 k 条目，其中 k 必须是每个数据点的维度(因此您的输入数据可能是一个 n×k 矩阵，其中每行代表一个 k 维数据点，以便计算出矩阵维度)。

然后您可以使用 X ~ 1-by-k 对未见过的数据点生成预测

 prediction = final_weights * X

和预测将是一个浮点值。 (您说您想要 0,+1,-1 作为您的目标值，但是您将需要不同的策略，具体取决于这些是无序标签还是有序值；即，如果它们代表温度，您可能会幸运地采用预测，但如果它们代表无序类别，您可能需要训练三个单独的模型，每个模型都指示落入特定类别的可能性。如果这看起来不清楚，请发表评论，我将添加编辑。 )

如果你真的愿意，你可以在上面使用任意一组权重；情况就是这样，您将使用完全由零或完全由随机数组成的权重向量生成糟糕的预测。训练过程(即所有这些迭代更新)是为了确保您拥有一个中等的权重向量，即根据过去的训练数据生成相当好的预测的权重向量。

With this weight vector, how do I apply it to a new data set?

使用上面的预测规则将其应用于新的、未见过的数据，一次一个数据点。

Where does gradient descent, mean-square errors, and convergence fit into this?

梯度下降就是通过上面提到的更新规则来实现的。考虑成本函数如何

 Cost(weights) := mean-square-error(weights)

是您所使用的权重的函数；你想最小化成本，所以你使用梯度下降来找到实现这一点的权重。我们说权重“收敛”，因为当您处于最佳权重集时，即使您继续迭代，它们也会停止更新。这样做的原因是错误会减少到零，当这种情况发生时，你的更新规则将是

new_weights = old_weights + (learning_rate * 0)

希望这是有道理的!

关于machine-learning - 关于神经网络权重向量的一般查询，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/39541521/

25

4

0

文章推荐： python - tensorflow 中补丁的点积

mysql - 如何根据用户声誉计算输入的重要性/权重？
我有几个系统，其中包含用户表以及某种形式的业力/权重/声誉。有时是用户发布的帖子数量，有时是用户在网站上的所有事件中收到的赞成/反对票数。 USER { id int name str
带有边距和填充的 Android 权重
我需要能够使用填充的相对大小 - 根据设备的分辨率和 dpi 变大或变小。例如，如果我的 View 宽度为 100 像素，我希望左侧填充 10 像素，右侧填充 10 像素。但是，如果它在更高密度的屏
search - Solr:如何指定字段相关性/权重
我目前正在使用由大约 10 个字段组成的 Solr 索引数据。当我执行搜索时，我希望某些字段的权重更高。谁能帮我指出正确的方向？例如，在所有字段中搜索“超人”等术语时，应在“Description”
r - 根据节点属性(权重)在网络中添加关系
我正在使用 igraph 模拟网络随时间的变化在 r并且我正在寻找一种有效且可扩展的方式来对此进行编码以用于业务。网络变化的主要驱动因素是: 新增节点新领带新节点权重在第一阶段，在 100 个
c++ - 使用OpenVINO上的c++ API获取模型每一层的参数/权重
我一直在寻找一种使用OpenVINO框架上的C++ API获取网络每一层权重/参数和偏差张量的方法。我在文档中找不到任何内容，在示例中也找不到任何示例。我如何提取这些张量？谢谢，塞萨尔编辑: 分
PHP memcache::addServer, 权重
我的问题与 PHP Memcache 扩展的 addServer 函数中的“weight”参数有关。在过去的几个月里，我一直在为所有服务器使用“weight = 1”。我现在正在尝试应用以下配置以最
java - 自定义数据结构(元素+权重)
我应该使用哪种数据结构来保持元素按给定权重排序？我需要在集合中添加元素，其中每个元素都会生成特定的权重，但该权重不包含(也不计算)在元素本身内部；它是由元素之外的其他人计算的。而且，权重不需要存储(但
python - 在分类焦点损失中使用 1-a 权重
我正在尝试在 keras/tensorflow 中使用具有多个类的焦点损失，这导致使用我猜的分类焦点损失。我找到了一些实现here和 there或there 。据我了解，焦点损失中的参数a主要用于二
python - Pandas value_counts() + 权重
我有一个像这样的 Pandas 数据框: df = pd.DataFrame({'id': [121, 34324, 111, 12, 45, 232], 'weight'
python - 充当线性缩放的 Tensorflow 权重
我有一个带有输出神经元的神经网络，我想在软最大化之前使用经过训练的权重进行线性缩放。我有 10 个输出，我想要 10 个权重，在输出被软最大化之前乘以每个输出。因此每个输出的权重为 1。但我不断收
android - 线性布局中的 ImageView 权重
我有这样的布局: 我希望它看起来像: TextView - 宽度的 40%，带 ImageView 的布局
安卓布局。权重、 ScrollView 、 ListView
这让我彻底疯了。我想在 android 中使用有点复杂的布局。我正在尝试使用权重而不是固定事物的大小。也许我应该放弃…… 这是我想做的: 我想要 3 个 ScrollView (里面有 TextVie
android - 以编程方式 LinearLayout 权重
我正在尝试开发类似于网格但使用 LinearLayout。我想在单行中有 3 张图像和图像后的确切底部文本。我尝试过的: LinearLayout layout = new LinearLayout
Android LinearLayout RelativeLayout 权重
我想在同一行添加一个 EditText 和一个 Button，我想将 80% 的行给 editText，20% 给 Button。这是我的代码:
PHP 权重 SQL 结果
我有一个 mysql 表，其中存储一列(称为 tickets)，并且 tickets 值可以是任意数字。我想要做的是有一个mysql查询，从列中选择所有行，按降序对它们进行排序，然后使用PHP对查询
mysql - 在MySQL中以一定的机会(权重)选择随机行
我搜索了一段时间，但结果让我很困惑，因为我对 MySQL 还很陌生。我有一个包含这 4 列的表:AUTO_INCREMENT ID、NAME、TYPE、CHANCE 所以行看起来像这样: 1, NO
javascript - 减少重复函数的 JavaScript 权重
我不完全是 JS 专业人士，虽然不漂亮或高效，但这是有效的。实际上，我在表单中有重复的字段组，并允许用户根据需要将数据从第一个字段复制到所有 5 个字段。如何使这段代码更高效？ function
python - 检索和修改 XGBoost 权重
我正在使用xgboost库来训练二元分类器。我想通过向权重添加噪声(例如集合中树的叶节点的值)来防止训练算法的数据泄漏。为此，我需要检索每棵树的权重并修改它们。我可以通过在 Booster 对象上使
android - 如何设置 View 权重？
我正在尝试让 LinearLayout 中的 View 填充宽度。我尝试使用 LayoutParams 设置它，但它给了我一个错误: 我的代码: EditText et = new EditText(
android - 以编程方式更改 ScrollView 权重
我想改变 ScrollView 的权重，但找不到实现它的方法。这是我的 XML: **other layout.. 从代码中只能设置scrollView的高度或者宽度，weigh

首页

博学

6Ren·AI

商城

machine-learning - 关于神经网络权重向量的一般查询