tensorflow - 深度学习中的融合核(或融合层)是什么？-6ren

tensorflow - 深度学习中的融合核(或融合层)是什么？

转载作者：行者123 更新时间：2023-12-03 13:33:13

24

4

我正在阅读 Apex AMP documentation :

A Python-only build omits:

Fused kernels required to use apex.optimizers.FusedAdam.

Fused kernels required to use apex.normalization.FusedLayerNorm.

Fused kernels that improve the performance and numerical stability of apex.parallel.SyncBatchNorm.

Fused kernels that improve the performance of apex.parallel.DistributedDataParallel and apex.amp. DistributedDataParallel, amp, and SyncBatchNorm will still be usable, but they may be slower.

似乎还有一个 "FusedAdam" optimizer :

The Adam optimizer in Pytorch (like all Pytorch optimizers) carries out optimizer.step() by looping over parameters, and launching a series of kernels for each parameter. This can require hundreds of small launches that are mostly bound by CPU-side Python looping and kernel launch overhead, resulting in poor device utilization. Currently, the FusedAdam implementation in Apex flattens the parameters for the optimization step, then carries out the optimization step itself via a fused kernel that combines all the Adam operations. In this way, the loop over parameters as well as the internal series of Adam operations for each parameter are fused such that optimizer.step() requires only a few kernel launches.

The current implementation (in Apex master) is brittle and only works with Amp opt_level O2. I’ve got a WIP branch to make it work for any opt_level (https://github.com/NVIDIA/apex/pull/351). I recommend waiting until this is merged then trying it.

这部分地解释了它。我还有更多问题:

内核是什么意思？层还是优化器？

融合层的想法与融合优化器相同吗？

最佳答案

这里的“内核”用于计算内核:https://en.wikipedia.org/wiki/Compute_kernel
像卷积这样的操作通常使用计算内核来实现，以提高效率。计算内核可以使用 C、CUDA、OpenCL 甚至汇编来编写，以实现最高效率。因此，“仅 Python 构建”不支持...并不令人惊讶...

“融合”意味着计算步骤的通用化。基本上，这是通过在单个硬件(GPU、CPU 或 TPU)操作中组合类似操作来更有效地运行代码的实现技巧。因此，“融合层”是操作受益于“融合”实现的层。

关于tensorflow - 深度学习中的融合核(或融合层)是什么？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/56601075/

24

4

0

文章推荐： reactjs - 创建 react 应用程序错误

文章推荐： reactjs - 未捕获的 TypeError : _this2. props.selectBook 不是函数

文章推荐： c# - 如何在不修剪的情况下使用DrawString？

c++ - 融合::vector + 融合::push_back = 融合::vector ？
我输入了一个包含两个元素的 vector 。然后我将另一个元素 push_back 到它，并期望什么结果类型也是一个 vector 。但事实并非如此。例子: typedef boost::fusio
svn - 颠覆、融合
首先让我先说，我以前在这里问过类似的问题，但从来没有得到解决我缺乏知识/问题的好答案。首先，让我从一个分支策略提案开始。这就是我们的工作，我很高兴听到其他评论，以及为什么这很糟糕。但要明白它通常对我
javascript - 字符串的第一个字符与 % 融合
所以我将一个带有 javascript 的字符串发送到 php 页面: if(cp.value!=''){ s+=cp.name +" LIKE '%"+ cp.value +"%'";
R - which 和 which.max 融合
我有一个简单的问题，我该如何使用 which和 which.max同时。我想选择最大值epnum为行 id == B13639J2 . 我需要检索 row number因为我需要对变量进行一些手动更
groovy - 文件上传与 Groovy 融合？
我想将带有 Groovy 脚本的文件上传到 Confluence。 As this Pythonscript example!我开始将代码翻译成 groovy， // Groovy def serve
c++ - 融合 vector 投影
我有一个融合 vector ，其元素具有多个不同类型的成员数据，我想创建一个新的融合 vector ，它将仅投影特定的数据成员。我已经对此进行了一段时间的研究，但没有任何进展。 #include #
python - 如何创建一个新页面以与 Python 融合
我正在尝试使用 Python 的 xmlrpclib 创建一个新的页面以汇合。我已经知道如何更新现有页面的内容，但如何创建一个全新的页面？我使用了以下脚本来更新内容: import xmlrpcli
vmware-fusion - Pow 和 VMware 融合
我正在使用 Pow 在 Mac OS X 上为 Rack 应用程序提供服务。http://myapp.dev正确显示应用程序。在同一台机器上，我使用 VMware Fusion 运行 Windows
cassandra - Apache Cassandra 如何与 Infinispan 融合？
我检查了 Cassandra 和 Infinispan 的主要特性。它们似乎具有并提供非常相似的特性和功能: NoSQL 数据存储坚持去中心化支持复制可扩展性容错 MapReduce 支持
search - Drupal 7搜索API，Elasticsearch连接器，聚合/融合
我在Drupal 7网站中使用Search API和Elasticsearch Connector。我已经在AWS中托管了elasticsearch。搜索完美无误。但是我想像在Drupal.org搜索
python - 融合 API 和 CMake 构建
我最近重新打开了几年前参与的一个项目。我写了一个小的 python 脚本来构建项目。我想将其移植到 CMake。我遇到的问题是脚本使用了 pkg-config在 linux 上找到 fuse 头文件
node.js - Yelp 融合 : Cannot get Tokens
我正在尝试访问 Yelp fusion API。我正在关注documentation并来到这段代码: const request = require('request'); // As you can
Ubuntu 融合 : No GSettings schemas are installed on the system
这是一个 vanilla Ubuntu 16.04 LTS，准确地说是基于 Xubuntu core。所以我需要自己安装包。除了 meld 之外，一切都很顺利，开始时，我会得到: (meld:4188
Java 流惰性 vs 融合 vs 短路
我正在尝试对惰性求值在 Java 流 API 中的应用形成一个简洁而连贯的理解。这是我目前的理解: 元素仅在需要时才被消耗，即流是惰性的，中间操作也是惰性的，例如过滤器，仅在需要时进行过滤。中间操
apache-kafka - 如何将没有模式的数据发送到 kafka - 融合 jdbc - 接收器使用？
我使用 conluent jdbc-sink 将数据从 kafka 加载到 oracle。但是我用数据编写了关于值(value)的模式。我不想用数据编写模式，如何在 kafka 主题上编写模式，然
matlab - 2D 融合 Lasso 与 Matlab CVX
我在这里编写了一个 2D 融合套索代码。 [m n] = size(circle); cvx_begin variable theta(m, n); minimize( norm(ci
C++ D3D9 Alpha 与 Creators Update 融合
目前我正在开发一个使用 dx9 创建叠加层的应用程序。现在我遇到了一个问题，自从我将 Windows 10 升级到最新版本(Creators Update)后，它无法使用 alpha channel
c# - Task.Delay 与 Task.Yield 融合？
我正在尝试编写类似 fiber 的代码，这样我就可以进入任务并从中退出。我试过的代码: class TaskActivity { CancellationTokenSource _m=new
javascript - 将 JavaScript NPM 项目与 Spring Boot 融合
我使用 NPM 在 React.js 中创建了一个前端。作为 IDE，我在这里使用 IntelliJ IDEA。该项目将使用我单独创建的 Spring Boot 编写的后端，也在 IntelliJ I
cassandra - 融合 3.3 升级后 Kafka-cassandra 连接器失败
Cassandra 连接器在融合升级到 3.3.0 后失败。 Cassandra驱动的版本是3.3。堆栈如下。 [2017-09-14 08:56:28,123] ERROR java.lang.re

首页

博学

6Ren·AI

商城

tensorflow - 深度学习中的融合核(或融合层)是什么？