- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我在理解如何对 Coursera 上提供的机器学习类(class)中的函数进行矢量化时遇到问题。
在类(class)中,Andrew Ng 解释了假设可以向量化为 theta 乘以 x 的转置:
H(x) = theta' * X
我的第一个问题是当我在练习中实现这一点时。为什么纸上的矢量化是 theta 的转置乘以 x,而 Octave 上的矢量化是 X 乘以 theta?
theta'*X % leads to errors while multiplying
我的第二个问题紧接着第一个问题。
当我想要向量化梯度下降函数的总和时:
sum((h(x)-y)*x))
我不太明白矢量化后如何实现这一点:
X'*(h(x)-y)
谁能解释一下吗?
最佳答案
这是一个品味问题。通常的约定是进行矩阵向量乘法,即您喜欢的。您可以通过调换所有内容从一种模式切换到另一种模式。也就是说,如果您的乘法 X*theta
有效,那么转置公式就是 theta。” * X.'
在X*theta
中,X
的每一行都包含一个样本点的数据(核函数值)。
在theta.'*X
约定中,X
的列包含样本点数据。
因此它始终取决于上下文,什么定义为行向量,什么定义为列向量,以及它们如何在更大的对象或操作中组合在一起。
关于math - Coursera 机器学习 : Gradient Descent vectorization,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46742462/
我正在尝试TensorFlow,但遇到了一个奇怪的错误。我编辑了较深的MNIST示例,以使用另一组图像,该算法再次很好地收敛,直到迭代8000(此时的精度为91%)崩溃并出现以下错误。 tensorf
我有一个包含项目数组的组件。 每次用户点击一个按钮,一个新的项目添加到这个数组。 这个数组以这种方式在 ngFor 循环中显示: 现在,新日志显示在列表底部。我正在尝试的是使新日志显示在列表
我正在用Python语言编写一个简单的递归下降解析器,它接受语法::=abc。我使用一个数组来存储用户提供的输入,并验证它是否正确。。我拥有的代码是:。当运行代码并键入abc(这应该是代码的有效条目)
我正在用Python语言编写一个简单的递归下降解析器,它接受语法::=abc。我使用一个数组来存储用户提供的输入,并验证它是否正确。。我拥有的代码是:。当运行代码并输入abc(这应该是代码的有效条目)
我在理解如何对 Coursera 上提供的机器学习类(class)中的函数进行矢量化时遇到问题。 在类(class)中,Andrew Ng 解释了假设可以向量化为 theta 乘以 x 的转置: H(
有没有办法通过梯度下降在 scikit-learn 中执行超参数调整?虽然超参数梯度的公式可能难以计算,但通过评估超参数空间中的两个接近点来对超参数梯度进行数值计算应该非常容易。是否有这种方法的现有实
我正在 Coursera 上学习 Andrew Ng 的 ML 类(class),对梯度下降有点困惑。我感到困惑的公式的屏幕截图在这里: 在他的第二个公式中,为什么他要乘以第 i 个训练示例的值?我认
我正在尝试创建自己的工具来创建 pdf 文件。一切都很顺利,我唯一想念的是字体描述符。请让我知道 afm/pfa/pfb 或任何可用于生成相同值的工具的 capheight、ascent、descen
我想使用 NVIDIA 卡进行一些 GPU 计算,并正在决定使用配备 2GB 还是 4GB 内存的 GTX 960。我应该服用哪一种?就我可以用于小批量梯度下降的批量大小而言,这些会有多大差异?这种差
这似乎是一个基本问题,但我在 SO 上找不到类似的问题。阅读时documentation ,我在理解概念时遇到了麻烦。我想了解 top 之间的区别是什么和 ascent还有 bottom和 desce
我是一名优秀的程序员,十分优秀!