- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
这是一个基于(或跟进)另一个问题的问题:Faster implementation of ReLU derivative .
本着想出一种最快计算导数的方法的精神,我写了一些解决方案,其中一个是:
In [35]: np.random.seed(0)
In [36]: X = np.random.randn(3072,10000)
# computing ReLU derivative
In [42]: np.ceil(np.clip(X, 0, 1))
同时将其与 other solutions of Divakar 进行基准测试,我发现上述方法非常慢(30x 以北)。以下是时间安排(从最快到最慢)
In [43]: %timeit -n100 ne.evaluate('X>=0').view('i1')
10.6 ms ± 203 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
In [44]: %timeit -n100 (X>=0).view('i1')
13.6 ms ± 77.5 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
In [45]: %timeit -n100 ne.evaluate('(X>=0)+0')
22.1 ms ± 16.7 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
# the super slowest one
In [46]: %timeit -n100 np.ceil(np.clip(X, 0, 1))
317 ms ± 2.14 ms per loop (mean ± std. dev. of 7 runs, 100 loops each)
导致这种缓慢的因素是什么?瓶颈在哪里?
最佳答案
首先,您只是在执行一系列更复杂的操作。对于每个输入,您的 ceil/clip 执行以下操作:
(这发生在两个阶段,一个完成所有裁剪,一个完成所有天花板。)
您正在根据对每个输入执行以下操作的选项来计时:
>= 更快也就不足为奇了。
其次,您的 ceil/clip 写入的字节数是 >= 的 16 倍。 >= 为每个输入元素生成一个字节的输出(view
是一个 View ,因此那里没有数据复制),而你的 ceil/clip 生成一个中间数组和一个输出数组,两者都是dtype float64。
第三,分支预测器在随机数组上的 clip
上表现不佳。它不知道每次会选择哪个分支。一个更可预测的数组通过 clip
的速度要快得多:
In [21]: %timeit X.clip(0, 1)
1 loop, best of 5: 211 ms per loop
In [22]: A = np.full_like(X, 0.5)
In [23]: %timeit A.clip(0, 1)
10 loops, best of 5: 86.6 ms per loop
最后,至少在我测试的机器和 NumPy 构建上,numpy.ceil
出奇地慢:
In [24]: %timeit np.ceil(X)
10 loops, best of 5: 166 ms per loop
我不确定它是在击中软件 ceil
实现还是什么。这在不同的构建中可能会有所不同。
关于python - ReLU 阈值 : where is the bottleneck? 中 numpy.ceil 和 numpy.clip 的缓慢,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55016198/
在其 API documentation ,它说“计算整流线性”。 是 Re(ctified) L(inear)... 那么 U 是什么? 最佳答案 Re(ctified) L(inear) (U)n
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 想改进这个问题?将问题更新为 on-topic对于堆栈溢出。 3年前关闭。 Improve this qu
我看到这里记录了这个“tf.nn.relu”:https://www.tensorflow.org/api_docs/python/tf/nn/relu 但后来我在“model_fn”的这个页面上也看
我只是想知道 的用途和专业之间是否有任何显着差异 Dense(activation='relu') 和 keras.layers.ReLu 后一个如何以及在哪里可以使用?我最好的猜测是在功能 API
我最近在做一个基于 TensorFlow 的 Udacity 深度学习类(class)。 .我有一个简单的 MNIST大约 92% 准确的程序: from tensorflow.examples.tu
我在使用 relu 激活函数时无法实现反向传播。我的模型有两个隐藏层,两个隐藏层都有 10 个节点,输出层有一个节点(因此有 3 个权重,3 个偏差)。除了这个损坏的 backward_prop 函数
由于neuralnet包没有ReLU功能,所以我尝试写ReLU功能的代码。但是有一个错误我不明白。请在下面查看我的代码和错误信息。 relu=0,x,0)} nn =0)} relu <- funct
由于neuralnet包没有ReLU功能,所以我尝试写ReLU功能的代码。但是有一个错误我不明白。请在下面查看我的代码和错误信息。 relu=0,x,0)} nn =0)} relu <- funct
我已经用 relu 作为激活函数在 tensorflow 中编写了一个卷积网络,但是它不是学习(对于评估和训练数据集,损失都是恒定的)。对于不同的激活函数,一切都按其应有的方式工作。 这是创建 nn
我正在使用 python 2.7 并试图更好地了解 tensorflow 。 我正在使用以下代码尝试在 mnist 数据上训练自动编码器,当我使用 sigmoid 激活时,它可以正常(90%),但是当
所以我开始使用 Pytorch,并在 FashionMNIST 数据集上构建一个非常基本的 CNN。我在使用神经网络时注意到一些奇怪的行为,我不知道为什么会发生这种情况,在前向函数中,当我在每个线性层
我正在根据负值和正值的数据训练神经网络。 有没有什么方法可以将数据输入 ReLU 网络,而不将其全部转换为正数,并且有一个单独的输入来表示数据是负数还是正数? 我看到的问题是,输入层的负输入意味着除非
ReLU 函数,在这种情况下,我使用了 leaky ReLU 给我错误的输出。但是使用 sigmoid 函数它给了我一个可接受的输出 这是我的代码: import numpy as np def re
在 keras 文档中,函数 keras.activations.relu(x, alpha=0.0, max_value=None, Threshold=0.0) 定义为: f(x) = max_v
我正在尝试使用神经网络 (Keras) 逼近正弦函数。 是的,我阅读了相关的帖子:) Link 1 Link 2 Link 3 使用四个带 sigmoid 的隐藏神经元和一个带线性激活的输出层效果很好
作为一个更大项目的一部分,我一直在构建一个编程语言检测器,即代码片段的分类器。我的基线模型非常简单:将输入标记化并将片段编码为词袋,或者,在这种情况下,bag-of-tokens,并在这些特征之上制作
我正在实现一个神经网络,并希望使用 ReLU 作为神经元的激活函数。此外,我正在使用 SDG 和反向传播训练网络。我正在用范例 XOR 问题测试神经网络,到目前为止,如果我使用逻辑函数或双曲正切作为激
测试代码: ? 1
最近我观察到,在定义神经网络时,我们多次为每一层定义单独的 ReLU 对象。为什么我们不能在需要的地方使用相同的 ReLU 对象。 例如而不是像这样写- def __init__(self):
我们使用 ReLu 而不是 Sigmoid 激活函数,因为它没有像激活函数一样存在于 Sigmoid 中的梯度消失和爆炸问题, Leaky-ReLU 是 rely 的改进之一。大家都在谈论 Leaky
我是一名优秀的程序员,十分优秀!