cuda - 使用 cuBLAS-XT 处理大输入量-6ren

cuda - 使用 cuBLAS-XT 处理大输入量

转载作者：行者123 更新时间：2023-12-02 07:43:16

25

4

This link cuBLAS-XT 例程提供核外操作 - 操作数数据的大小仅受系统内存大小的限制，而不受 GPU 板载内存大小的限制。这意味着只要输入数据可以存储在 CPU 内存上并且输出大小大于 GPU 内存大小，我们就可以使用 cuBLAS-XT 函数，对吧？

另一方面，this link说“在非常大的问题的情况下，cublasXt API 提供了将部分计算卸载到主机 CPU 的可能性”和“目前，只有例程 cublasXtgemm() 支持此功能。输入大小的问题是否属于这种情况是否大于 CPU 内存大小？

我不明白这两者之间的区别!如果有人帮助我理解其中的差异，我将不胜感激。

最佳答案

cublasXt 的目的是允许操作在多个 GPU 上自动运行。例如，矩阵乘法或其他支持的运算可以在多个 GPU 上运行。

cublasXtgemm 例程具有特殊功能，除了在 2 个或更多 GPU 上并行化矩阵乘法之外，它还可以在 2 个或更多 GPU 上并行化矩阵乘法PLUS使用主机CPU作为额外的计算引擎。

矩阵乘法问题很容易分解，如所讨论的 here 。如果您仅在 GPU 上运行所有“ block ”工作，这就是 cublasXtgemm 的普通功能(仅使用 GPU)。如果您在 GPU 上运行除其中一个工作 block 之外的所有工作 block ，并在 CPU 上运行其中一个工作 block ，这就是特殊功能。

关于cuda - 使用 cuBLAS-XT 处理大输入量，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/40440074/

25

4

0

文章推荐： vb.net - 隐藏基类中的可重写方法

文章推荐： javascript - 获取元素在 div 中的索引/位置 - 纯 javascript

文章推荐： regex - 使用正则表达式在 html 文件中搜索随机字符串

文章推荐： gcc - 警告 : cast to/from pointer from/to integer of different size

haskell - mapMonadTrans::MonadTrans xT => (m a -> n b) -> xT m a -> xT n b
问题是这个。我有: f :: MonadIO m => ReaderT FooBar m Answer; f = (liftIO getArgs) >>= ... 我需要使用修改后的参数运行它。但是，
c++ - xtensor xt::where与索引相关的功能出现问题
在这里，我试图对C++中的xtensor库进行非常基本的操作。我有xarray a，并且有了index related function xt::where，我想获取条件为True的索引数组(请注意，
c++ - 如何使用 xt::repeat？
我想以与 numpy 相同的方式获得重复数组但是 xt::repeat返回表达式。当我尝试将此表达式转换为数组时，出现编译错误。 xt::array a = {{1, 2}, {3, 4}}; aut
perl - 如何运行 perl xt 测试？
最近，Perl 世界中出现了新的伟大事物。长期以来在库包有文件夹t包含测试。现在有一个更多文件夹xt包含作者测试。 xt不需要测试库安装的过程，但它有助于库作者确保代码很棒。有一个 Spri
cuda - 使用 cuBLAS-XT 处理大输入量
This link cuBLAS-XT 例程提供核外操作 - 操作数数据的大小仅受系统内存大小的限制，而不受 GPU 板载内存大小的限制。这意味着只要输入数据可以存储在 CPU 内存上并且输出大小大于
compiler-construction - Stratgo/XT 编程语言
有谁知道Stratego/XT编程语言？到底有什么好处呢？有什么好的和/或不好的经历吗？任何真实的现场运行示例？非常感谢。最佳答案 Stratego/XT 是一种基于术语重写和可编程重写策略的程序
javascript - FusionMaps XT - VueJs - 不工作事件connectorClick
我有一个使用 VueJS 处理的 map ，但我在事件connectorClick 方面遇到问题。在下面的示例中，当单击连接线时，警报不起作用。 Vue.use(VueFusionCharts, Fu
c++ - 如何将 xt::sum 表达式结果转换为整数
我刚开始使用 xtensor，我已经陷入了一个基本问题。我正在使用类似 xt::sum(xt::where(egoLaneLeftCount, 1, 0)) 的方法对列求和并获得单个整数值。我想将这
numpy - xt::where 用于 xtensor C++ 的示例用法
我是 xtensor 的新手。我想知道如何使用 xt::where 的输出。在 python 中，例如假设 imap 是一个 nd 数组， np.where(imap>=4) 返回两个带索引的数组，可
javascript - jQuery Lazy Load XT - 在自定义事件上强制加载图像
每次从没有文档的 jQuery Carousel 插件调用 switchSlide() 方法时，我都会触发一个自定义事件 switchSlideEvent 。我正在使用 Lazy Load XT (
javascript - 在 Lazy Load XT 上强制加载图像
知道如何强制加载特定 div 的Lazy Load XT jQuery plugin ? 我的意思是 data-src="" 图像将在页面加载后自动加载而无需页面滚动或视口(viewport)。此插
c++ - 在 xtensor 中使用 xt::where 时遇到问题
我正在尝试在 xarray 中查找某些数组值的索引值。我有一个名为 lattice 的 xarray，其中包含数字 1 到 n，我想要的是类似 auto x2 = xt::where(lattice
android - 如何拦截 Parrot B350-XT 蓝牙耳机的蓝牙按钮事件？
我的蓝牙耳机 (Parrot B350-XT) 有 4 个按钮: 调高音量调低音量电源按钮 “鹦鹉”按钮我正在创建一个在三星 SM-T230NU 上运行的 Android 应用程序 (OS 4.
macos - Xt 错误 : Can't open display, 如果使用默认显示
概述我正在尝试让 XQuartz 在 OSX 上工作，这样我就可以通过 Docker 进行 X11 转发。我关注 the instructions here .我相信我的问题可能只由第一部分回答，但
perl - 我应该将 perl 'xt' 测试上传到 CPAN 吗？
不久前，Perl 世界中出现了新事物。事情是创造xt模块源代码中的目录并在那里放置应该只能由作者运行。 xt 的想法测试是它们没有运行时该模块是从 CPAN 安装的。我在想如果安装过程不需要测试
program-transformation - 战略/XT : Understanding the basic of basics
我确实尝试过了解 Stratego/XT 的第一步。我在谷歌上搜索了很多，我发现的所有网络资源在开始时似乎都取得了足够大的飞跃，以至于我无法建立联系。让我解释一下。我是这样理解抽象语法树的: Min
php - xt:Commerce 嵌套集 categories_left 和 categories_right
很久以前，我为 xt:Commerce 构建了一个导入器，在 v4.1 之前运行良好。数据来自与以前相同的 PIM 系统。但是现在，v4.2.0 已经出来了，他们为类别添加了一个嵌套集。无论如何没关
ios - 尝试通过 FusionCharts XT 在 iOS 上绘制图表
我是 Xcode 的新手，我正在学习它并尝试一些东西......现在我尝试通过 FusionCharts XT 在 iOS 上绘制图表。我将 webView 添加到我的屏幕并从 FusionChart
android - Motorola CLIQ XT 上的网络接口(interface)名称是什么？
Android 接口(interface)上的网络接口(interface)在 /sys/class/net/ 中的文件系统中作为目录列出。对于大多数 Android 设备，gprs 流量的网络接口
linux - 从 OSF/Motif & Xt 迁移到 GTK+
我有一个用 Xt(X Tools Intrinsic 库)编写的名为 XClient 的类，用于设置多套接字连接。这个 XClient 类用于 OSF/Motif GUI 以扩展 XClient(因此

首页

博学

6Ren·AI

商城

cuda - 使用 cuBLAS-XT 处理大输入量