- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个问题,需要我对许多 (~4k) 小 (~3x3) 方形厄米矩阵进行特征分解和矩阵乘法。特别是,我需要每个工作项执行一个这样的矩阵的特征分解,然后执行两个矩阵乘法。因此,每个线程必须做的工作相当少,而且整个工作应该是高度可并行的。
不幸的是,似乎所有可用的 OpenCL LAPACK 都用于将大型矩阵上的操作委托(delegate)给 GPU,而不是用于在 OpenCL 内核中执行较小的线性代数运算。因为我不想实现矩阵乘法和 eigendecomposition对于我自己在 OpenCL 中任意大小的矩阵,我希望这里有人可能知道适合这项工作的库?
我知道自从矩阵类型 is reserved 以来,OpenCL 可能会在某个时候获得内置矩阵运算。 ,但现在这并没有多大用处。还有一个类似的问题here从 2011 年开始,但它几乎只是说要自己动手,所以我希望从那时起情况有所改善。
最佳答案
总的来说,我使用 LAPACK、fftw、cuFFT 等库的经验是,当您想解决许多像这样非常小的问题时,最好自己编写以提高性能。这些库通常是为通用性而编写的,因此您通常可以在特定的小问题上击败它们的性能,特别是如果您可以使用特定问题的独特属性。
我知道您不想听到“自己动手”,但对于此类问题,IMO 确实是最好的做法。您可能找到一个库来执行此操作,但考虑到您真正(为了性能)想要的代码不会泛化,我怀疑它是否存在。您将专门寻找代码来查找 3x3 矩阵的特征值。这与其说是一个库,不如说是一个具有合适许可证的随机代码片段,您可以操纵它来利用您的特定问题。
在这种特定情况下,您可以使用特征多项式通过教科书方法求出 3x3 矩阵的特征值。请记住,三次方程有一个相对简单的封闭形式解:http://en.wikipedia.org/wiki/Cubic_function#General_formula_for_roots .
虽然我认为这种方法很可能比迭代方法快得多,但验证性能是否是一个问题是明智的。
关于matrix - 在 OpenCL 中并行执行许多小矩阵运算,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21049037/
问题来自 Julia Discourse 我正在使用 Julia 1.2。这是我的测试: a = rand(1000, 1000) b = adjoint(a) c = copy(b) @btime
给定两个 m x n 矩阵 A 和 B,其元素属于集合 S。 问题:A 的行和列可以置换为 B 吗? 解决这个问题的算法的复杂度是多少? 行列式有部分帮助(当 m=n 时):必要条件是 det(A)
这是共同计算平移和旋转的正确方法,还是有更好的方法?目前我的代码先翻译然后旋转,这会造成问题吗? 代码 from math import cos, sin, radians def trig(angl
如何在 core.matrix 中将矩阵和向量元素相乘? 我正在尝试找到与以下 Octave 音程代码等效的 core.matrix: A = [1 2 3 4; 5 6 7 8] B = [2; 3
我是 Scilab 的新用户(另见 here)。 我定义了一个简单的分段函数,并在使用该函数 ( "Warning adding a matrix with the empty matrix will
我有一个像这样的 RDD: (A,AA,1) (A,BB,0) (A,CC,0) (B,AA,2) (B,BB,1) (B,CC,4) 我想将其转换为以下 RRD: ([1,0,0],[2,1,4])
我使用的矩阵如下 (require '[clojure.core.matrix :as ccm]) (def M (ccm/matrix [[1 2] [3 4]])) (ccm/mset! M 0
我有一个矩阵类,它有一组函数,其中一个是矩阵运算符++(); 构造函数: Matrix(int num_rows,int num_col,int initialization,double initi
我有一个矩阵如下; 1 2 3 4 5 1 0 1 1 0 0 2 0 0 1 1 0 3 1 0 0 0 1 4 0 0 1 0 0
我已经部署了为家庭服务器(synapse)运行的单个实例,并附加了多个域作为 example.com 和 example1.com。我想创建像 [email protected] 这样的用户和 [em
我有 200 个向量;每一个的长度都是 10000。 我想填充一个矩阵,使每一行代表一个向量。 最佳答案 如果你的向量已经存储在一个数组中,那么你可以在这里使用 vcat( ): A = [rand(
如何向现有矩阵添加行或列?我正在尝试添加一个偏差项(一列)作为矩阵的第一行。在 Octave 中我可以这样做: M = [ones(size(M, 1), 1), M]; 最佳答案 您可以使用 joi
我正在使用 GNU GSL 进行一些矩阵计算。我正在尝试将矩阵 B 与矩阵 A 的逆矩阵相乘。 现在我注意到 GSL 的 BLAS 部分有一个函数可以做到这一点,但前提是 A 是三角形。这有什么具体原
我想计算如下:Matrix * Matrix Matrix有大约 6M*3 个元素,如何转换 Matrix至 Matrix这样我就能得到 Matrix结果。 最佳答案 您可以使用 Map 函数将 do
我只是没有看到我的错误。关于此错误消息的问题太多了,答案要么不适用,要么我只是看不到它们适用。也许应该改进错误消息? Matrix a = Matrix(3, 4); // fill a with v
在android.opengl.Matrix类中有两种旋转矩阵的方法,它们是: static void rotateM (float[] m, int mOffset, float a, float
我正在使用 C++ 进行编码,并且使用的是 FEniCS fenics/2016.1.0。我的部分代码是 Matrix A; Vector f; std::vector> dirichlet_matr
JAMA(用于矩阵计算的 java 库)中的 JAMA:Matrix.times() 与 Matrix.arrayTimes() 有什么区别 如果我有一个d维度 vector x和一个k维度 vect
我试图做的是简单地将 cublasDgemm(矩阵-矩阵乘法)应用于多个具有“双”(8 字节)类型元素的矩阵,所有这些元素都具有一个非常大的维度。在我的例子中,矩阵的大小是 12755046 x 46
我正在尝试使用 android Matrix 对象旋转给定的位图。 我想将它发送到我的服务器,我正在使用 Android API8。 我应该使用 Matrix.setRotate 还是 Matrix.
我是一名优秀的程序员,十分优秀!