sparse-matrix - GPU 或 CPU 上的稀疏矩阵乘法？-6ren

sparse-matrix - GPU 或 CPU 上的稀疏矩阵乘法？

转载作者：行者123 更新时间：2023-12-01 13:05:25

29

4

你怎么认为？什么会更快，多快:在 GPU 或 CPU(多线程)上进行稀疏矩阵 (CSR) 乘法(带有向量)？

最佳答案

这取决于矩阵的大小和需要执行的迭代次数。这是因为您需要将矩阵数据从 CPU 内存复制到 GPU 内存，并将结果从 GPU 复制回 CPU。如果您只想在矩阵上执行一次迭代，那么在 CPU 上执行它总是比在 GPU 上执行它更好。此外，GPU 受到启动时间的影响。因此，如果您要执行更多迭代，则选择 GPU，否则我的选择将是 CPU。同样，由于数据复制，矩阵的大小也会影响性能。

关于sparse-matrix - GPU 或 CPU 上的稀疏矩阵乘法？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/3438826/

29

4

0

文章推荐： .net - emum 的多个描述属性

文章推荐： java - 在 Android 应用程序中设置和打开 fragment 的问题

文章推荐： asp.net-mvc - 使用默认模型 Binder 映射集合的约定是什么？

文章推荐： Java JTextField 不会显示

scipy - scipy.sparse.linalg.lsmr和scipy.sparse.linalg.lsqr之间的区别
有人知道什么时候最好选择哪个吗？在我看来，它们是一样的... lsmr lsqr 最佳答案两种软件包的功能相同。 LSMR基于2010年的Fong＆Saunders算法(请参阅paper)，并且最近
python - SciPy.sparse 迭代求解器 : No sparse right hand side support?
似乎 scipy.sparse.linalg 的迭代求解器不支持 scipy.sparse 的稀疏矩阵数据类型作为方程系统的右侧(而直接求解器会)。考虑以下简短示例: import numpy as
python - pd.get_dummies 数据帧在 Sparse = True 时与 Sparse = False 时大小相同
我有一个包含多个字符串列的数据框，我想将其转换为分类数据，以便我可以运行一些模型并从中提取重要特征。但是，由于唯一值的数量，单热编码数据会扩展到大量列，从而导致性能问题。为了解决这个问题，我正在试
rsync --sparse 确实传输整个数据
我有一些需要每天同步的 VM 镜像。 VM 文件是稀疏的。为了节省网络流量，我只想传输图像的真实数据。我在 rsync 中使用 --sparse 选项进行尝试，但在网络流量上，我看到整个大小都通过
sparse-matrix - Bigtable中稀疏表的稀疏和目的是什么？
我有一些不明白的信息: Bigtable may be understood a sparse table. Most cells contain nullvalues - too sparse to
matlab - 我什么时候应该使用 `sparse` ？
我一直在查看 Matlab 的 sparse documentation试图找出是否有任何指导方针来说明何时使用稀疏表示而不是完整表示是有意义的。例如，我有一个包含大约 30% 非零条目的矩阵 da
sparse-matrix - Chapel 循环变量未声明
当我尝试编译以下程序时，编译器提示 j 和 row 未声明，这让我感到惊讶，因为 Chapel - Ranges defined using bounds of type 'range(int(64)
sparse-matrix - HDF5 中的稀疏数组支持
我需要以某种方式在磁盘上存储一个 512^3 阵列，我目前使用的是 HDF5。由于阵列稀疏，因此浪费了大量磁盘空间。 HDF5 是否为稀疏数组提供任何支持？最佳答案一种解决方法是使用 compre
sparse-matrix - TensorFlow 中是否实现了稀疏张量乘法？
稀疏张量与自身或密集张量的乘法在 TensorFlow 中似乎不起作用。下面的例子 from __future__ import print_function import tensorflow as
linux - git sparse-checkout忽略特定的文件类型
我有一个git存储库，其中有一堆大型csv，我不想克隆，因此我遇到了git sparse-checkout和这篇文章:https://github.blog/2020-01-17-bring-your
R矩阵包: Demean sparse matrix
是否有一种简单的方法可以按列贬低稀疏矩阵，同时将零值视为缺失(使用 Matrix 包)？我似乎遇到两个问题: 找到合适的列意味着空单元格被视为零而不是缺失: M0 或者@user20650评论
sparse-matrix - 使用稀疏数据进行特征缩放/归一化
我在训练具有稀疏输入数据的神经网络以解决监督回归问题时遇到问题。当我对输入数据执行均值归一化(减去均值再除以标准差)时，我得到了很多NaN值。我想知道是否有人有处理此类问题的经验。缩放稀疏输入数据的正
sparse-matrix - 特征 - 稀疏矩阵的对角线更新
在 Eigen 中编辑稀疏矩阵对角线的最快方法是什么？我已经使用三元组填充了它，但我偶尔需要更改所有对角线值(它们已经设置为非零值)。最佳答案如果可以接受，您可以简单地使用它们的索引，例如 sp_
machine-learning - "sparse"在神经网络中意味着什么？
我看到“稀疏”和“稀疏”的使用方式表明它可以提高模型的准确性。例如: I think the unsupervised phase might be not so important if some
c++ - MATLAB编码器: sparse matrix
MATLAB Coder 似乎很花哨，可以通过将代码转换为 C/C++ 或 MEX 来加快 MATLAB 代码的速度。但是它似乎不支持稀疏矩阵，或者 matlab 函数 sparse 这对我的代码至关
python sparse gmres 混淆了输入参数
我有一个使用 scipy.sparse.linalg.gmres 求解稀疏线性系统的简单代码 W, S = load_data() M = normalize(W.T.astype('float64
python - Keras "sparse"张量上张量分配的最佳方法
我正在尝试创建一个大小为 n 的多维数组(其中 n 是符号形状张量的一部分)。该数组在每个区域中都应有 0，但很少有区域是变量 b_class。这是一个简单的 Numpy 实现，但在这种情况下，我们
java - StandardOpenOption.SPARSE 有什么用？
Java 7 defines this option ，但我不明白它的用处。考虑这个简单的程序，它在一台足够新的 Linux 机器上运行，带有 Java 6 JVM: public static vo
python - scipy.sparse 矩阵的点例程产生错误
我有一个 CSR matrix : >> print type(tfidf) 我想对 CSR matrix 的两行进行点积: >> v1 = tfidf.getrow(1) >> v2 = tfid
python - scipy.sparse 矩阵的索引操作向量化
尽管一切似乎都已矢量化，但以下代码运行速度太慢。 from numpy import * from scipy.sparse import * n = 100000; i = xrange(n); j

首页

博学

6Ren·AI

商城

sparse-matrix - GPU 或 CPU 上的稀疏矩阵乘法？