neural-network - 如何将深度学习梯度下降方程转化为python-6ren

neural-network - 如何将深度学习梯度下降方程转化为python

转载作者：行者123 更新时间：2023-12-05 08:55:25

27

4

我一直在关注有关深度学习的在线教程。它有一个关于梯度下降和成本计算的实际问题，一旦它被转换为 python 代码，我就一直在努力获得给定的答案。希望你能帮我得到正确的答案

请参阅以下链接以了解所使用的方程式 Click here to see the equations used for the calculations

以下是计算梯度下降、成本等的函数。需要在不使用 for 循环但使用矩阵操作操作的情况下找到值

import numpy as np

def propagate(w, b, X, Y):
"""
Arguments:
w -- weights, a numpy array of size (num_px * num_px * 3, 1)
b -- bias, a scalar
X -- data of size (num_px * num_px * 3, number of examples)
Y -- true "label" vector (containing 0 if non-cat, 1 if cat) of size
  (1, number of examples)

Return:
cost -- negative log-likelihood cost for logistic regression
dw -- gradient of the loss with respect to w, thus same shape as w
db -- gradient of the loss with respect to b, thus same shape as b

Tips:
- Write your code step by step for the propagation. np.log(), np.dot()
"""

m = X.shape[1]


# FORWARD PROPAGATION (FROM X TO COST)
### START CODE HERE ### (≈ 2 lines of code)
A =                                      # compute activation
cost =                                   # compute cost
### END CODE HERE ###


# BACKWARD PROPAGATION (TO FIND GRAD)
### START CODE HERE ### (≈ 2 lines of code)
dw = 
db = 
### END CODE HERE ###


assert(dw.shape == w.shape)
assert(db.dtype == float)
cost = np.squeeze(cost)
assert(cost.shape == ())

grads = {"dw": dw,
         "db": db}

return grads, cost

下面是测试上述功能的数据

w, b, X, Y = np.array([[1],[2]]), 2, np.array([[1,2],[3,4]]), 
np.array([[1,0]])
grads, cost = propagate(w, b, X, Y)
print ("dw = " + str(grads["dw"]))
print ("db = " + str(grads["db"]))
print ("cost = " + str(cost))

以下是上面的预期输出

Expected Output:
dw  [[ 0.99993216] [ 1.99980262]]
db  0.499935230625
cost    6.000064773192205

对于上面的传播函数，我使用了下面的替换，但输出不是预期的。请帮助如何获得预期的输出

A = sigmoid(X)
cost = -1*((np.sum(np.dot(Y,np.log(A))+np.dot((1-Y),(np.log(1-A))),axis=0))/m)
dw = (np.dot(X,((A-Y).T)))/m
db = np.sum((A-Y),axis=0)/m

以下是用于计算 Activation 的 sigmoid 函数:

def sigmoid(z):
  """
  Compute the sigmoid of z

  Arguments:
  z -- A scalar or numpy array of any size.

  Return:
  s -- sigmoid(z)
  """

  ### START CODE HERE ### (≈ 1 line of code)
  s = 1 / (1+np.exp(-z))
  ### END CODE HERE ###

return s

希望有人能帮助我理解如何解决这个问题，因为如果不理解这一点，我将无法继续学习其余教程。非常感谢

最佳答案

您可以按如下方式计算 A,cost,dw,db:

A = sigmoid(np.dot(w.T,X) + b)     
cost = -1 / m * np.sum(Y*np.log(A)+(1-Y)*np.log(1-A)) 

dw = 1/m * np.dot(X,(A-Y).T)
db = 1/m * np.sum(A-Y)

乙状结肠在哪里:

def sigmoid(z):
    s = 1 / (1 + np.exp(-z))    
    return s

关于neural-network - 如何将深度学习梯度下降方程转化为python，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/45832369/

27

4

0

文章推荐： css - ionic 2 : Display array of items in a 3x3 table

文章推荐： html - 如何在悬停时添加文本

文章推荐： r - 具有刻面比例和动态 geom_text 位置的 ggplot

Metapost 方程
在我的一门类(class)中，我接到了一项家庭作业，要求我们在谷歌上搜索 Metapost 语言并找到该语言中方程求解功能的用途。在浏览了 Metapost 用户手册的前十多页后，我发现只有一个原因
charts - 无法隐藏谷歌图表趋势线上的工具提示(方程)
你能帮我在 this page 上的谷歌图表上隐藏趋势线上的工具提示(方程)吗？ ? 谢谢以下是我正在使用的图表选项: var options = { title: 'Weight
正则表达式匹配 LaTeX 方程
我正在尝试将 TeXWorks 编辑器配置为使用与 TeXMaker 相同的语法着色。但是，TexWorks 使用正则表达式来指定应该着色的内容。不幸的是，它没有数学的默认设置。我想匹配 $ 之间的
求解实数的 Haskell 方程
我刚开始玩 GHCi。我看到列表生成器基本上解决了给定集合中的方程式: Prelude> [x | x [0.01,0.2..2.0] [1.0e-2,0.2,0.39,0.580000000000
Java 方程/表达式生成器
是否有可以使用的图形表达式生成器或方程编辑器的 Java 开源实现？最好有在线演示，或者至少有屏幕截图。最佳答案取决于方程的类型。如果您正在考虑简单的多项式，您可以尝试 Java Expres
带有负数和正数的 JavaScript 方程
我有四个文本输入字段，在用户输入相关值后，我必须进行 JavaScript 计算以将它们全部相加我使用: var total = Number(value1) + Number(value2) +
c++ - bool 方程
为什么这段代码有两个不同的输出(GCC 4.5.1)(我已经评论了重要的行): int main() { bool a = 1; bool b = 1; bool c = 1;
ios - 自适应精度算法/方程
如果标题含糊不清，我深表歉意，但我不知道如何为我的情况命名。我正在为使用 GPS 的 iPhone 编写一个应用程序。在 didUpdateLocations: 方法中，我针对任意大小的变量测试位置的
mysql - SQL bmi 方程
我正在尝试计算表中学生的 BMI，四舍五入到三位数: +-------+--------+--------+ | fname | weight | height | +-------+--------
r - 如何求解嵌套的 ODE 方程
我们可以使用 deSolve R 中的常微分方程 (ODE) 包，但是，我找不到解决两个嵌套 ODE 方程的方法，假设` b'(t) = beta - k*b(t); a'(t) = alpha -b
boolean - 简化 boolean 方程
我有一个 boolean 方程，想简化它。帮忙解决一下。 bool needLoad = isA || (!isA && !isB); 之后我使用 if (needLoad){ if (
modeling - 在仿真工具中求解(非线性)方程
我很感兴趣，建模工具(在我的例子中是 OpenModelica 和 Dymola - 建模语言 Modelica)如何求解方程组(线性和/或非线性)。这些工具专为求解微分代数方程而设计。我知道一点将微
plot - Julia :当我有情节时如何找到最佳拟合曲线/方程？
Julia:当我有绘图时如何找到最佳拟合曲线/方程？我有一个用 map 绘制的图，但我需要找到一个适合它的二次方程？最佳答案正如评论中所说，有一个情节在这里并不真正相关；只有数据本身是。您可以使用
javascript - 将文本框链接到由按钮运行的 JavaScript 方程
我一直在尝试将像 100, 45 这样的输入放入文本框中，并通过单击按钮通过我的方程式运行它，但我不知道该怎么做。单击按钮后，它应该发布答案作为警报。请帮忙。谢谢。 function Rad(a, b
plot - Julia :当我有情节时如何找到最佳拟合曲线/方程？
Julia:当我有绘图时如何找到最佳拟合曲线/方程？我有一个用 map 绘制的图，但我需要找到一个适合它的二次方程？最佳答案正如评论中所说，有一个情节在这里并不真正相关；只有数据本身是。您可以使用
JAVA System.out.println 方程
有人可以向我解释为什么下面的代码会打印字符“u”吗？ int p = 9; int q = 5; int r = p - q; double x = p; double y = q; St
python - 如何使用辅助函数缩短 ODE 方程
我想以某种方式缩短我的 ODE 方程，因为否则代码会变得困惑。我尝试过使用辅助函数，例如这里的 fe() ，但这不起作用。下面的代码只是一个例子，欢迎任何建议!谢谢! # Import the req
c - 如何迭代这个 sin 方程？
我无法创建正确的文件。程序中的方程不会迭代，它只会根据请求的数量写入相同的总和。 for 循环。 #include #include #include #define LEN 256 int m
c - 奇怪的 printf 方程
我有 2 个指向一些 Point 结构的指针。我想计算两点之间的距离(我不需要计算它的根)所以我有这个: w[0]=X[l]; w[1]=X[l+1]; d=m(w[0]->x
html 表格行中或数据库本身中的 PHP 方程
我有一个具有 CSV 上传功能的网站，它将 CSV 中的所有内容推送到临时表，然后分成较小的表。目前，我有一个显示页面，在 HTML 表格中显示所有这些信息。然而，有些部分需要有公式化的表示。换句话

首页

博学

6Ren·AI

商城

neural-network - 如何将深度学习梯度下降方程转化为python