- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
由于许多机器学习算法依赖于矩阵乘法(或者至少可以使用矩阵乘法来实现)来测试我的 GPU,因此我计划创建矩阵 a 、 b ,将它们相乘并记录完成计算所需的时间。
下面的代码将生成两个维度分别为 300000,20000 的矩阵并将它们相乘:
import tensorflow as tf
import numpy as np
init = tf.global_variables_initializer()
sess = tf.Session()
sess.run(init)
#a = np.array([[1, 2, 3], [4, 5, 6]])
#b = np.array([1, 2, 3])
a = np.random.rand(300000,20000)
b = np.random.rand(300000,20000)
println("Init complete");
result = tf.mul(a , b)
v = sess.run(result)
print(v)
这是比较 GPU 性能的充分测试吗?我还应该考虑哪些其他因素?
最佳答案
这是一个example matmul 基准测试,它避免了常见的陷阱,并且与 Titan X Pascal 上的官方 11 TFLOP 标记相匹配。
import os
import sys
os.environ["CUDA_VISIBLE_DEVICES"]="1"
import tensorflow as tf
import time
n = 8192
dtype = tf.float32
with tf.device("/gpu:0"):
matrix1 = tf.Variable(tf.ones((n, n), dtype=dtype))
matrix2 = tf.Variable(tf.ones((n, n), dtype=dtype))
product = tf.matmul(matrix1, matrix2)
# avoid optimizing away redundant nodes
config = tf.ConfigProto(graph_options=tf.GraphOptions(optimizer_options=tf.OptimizerOptions(opt_level=tf.OptimizerOptions.L0)))
sess = tf.Session(config=config)
sess.run(tf.global_variables_initializer())
iters = 10
# pre-warming
sess.run(product.op)
start = time.time()
for i in range(iters):
sess.run(product.op)
end = time.time()
ops = n**3 + (n-1)*n**2 # n^2*(n-1) additions, n^3 multiplications
elapsed = (end - start)
rate = iters*ops/elapsed/10**9
print('\n %d x %d matmul took: %.2f sec, %.2f G ops/sec' % (n, n,
elapsed/iters,
rate,))
关于matrix - 使用 tensorflow 矩阵乘法测试 GPU,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41804380/
问题来自 Julia Discourse 我正在使用 Julia 1.2。这是我的测试: a = rand(1000, 1000) b = adjoint(a) c = copy(b) @btime
给定两个 m x n 矩阵 A 和 B,其元素属于集合 S。 问题:A 的行和列可以置换为 B 吗? 解决这个问题的算法的复杂度是多少? 行列式有部分帮助(当 m=n 时):必要条件是 det(A)
这是共同计算平移和旋转的正确方法,还是有更好的方法?目前我的代码先翻译然后旋转,这会造成问题吗? 代码 from math import cos, sin, radians def trig(angl
如何在 core.matrix 中将矩阵和向量元素相乘? 我正在尝试找到与以下 Octave 音程代码等效的 core.matrix: A = [1 2 3 4; 5 6 7 8] B = [2; 3
我是 Scilab 的新用户(另见 here)。 我定义了一个简单的分段函数,并在使用该函数 ( "Warning adding a matrix with the empty matrix will
我有一个像这样的 RDD: (A,AA,1) (A,BB,0) (A,CC,0) (B,AA,2) (B,BB,1) (B,CC,4) 我想将其转换为以下 RRD: ([1,0,0],[2,1,4])
我使用的矩阵如下 (require '[clojure.core.matrix :as ccm]) (def M (ccm/matrix [[1 2] [3 4]])) (ccm/mset! M 0
我有一个矩阵类,它有一组函数,其中一个是矩阵运算符++(); 构造函数: Matrix(int num_rows,int num_col,int initialization,double initi
我有一个矩阵如下; 1 2 3 4 5 1 0 1 1 0 0 2 0 0 1 1 0 3 1 0 0 0 1 4 0 0 1 0 0
我已经部署了为家庭服务器(synapse)运行的单个实例,并附加了多个域作为 example.com 和 example1.com。我想创建像 [email protected] 这样的用户和 [em
我有 200 个向量;每一个的长度都是 10000。 我想填充一个矩阵,使每一行代表一个向量。 最佳答案 如果你的向量已经存储在一个数组中,那么你可以在这里使用 vcat( ): A = [rand(
如何向现有矩阵添加行或列?我正在尝试添加一个偏差项(一列)作为矩阵的第一行。在 Octave 中我可以这样做: M = [ones(size(M, 1), 1), M]; 最佳答案 您可以使用 joi
我正在使用 GNU GSL 进行一些矩阵计算。我正在尝试将矩阵 B 与矩阵 A 的逆矩阵相乘。 现在我注意到 GSL 的 BLAS 部分有一个函数可以做到这一点,但前提是 A 是三角形。这有什么具体原
我想计算如下:Matrix * Matrix Matrix有大约 6M*3 个元素,如何转换 Matrix至 Matrix这样我就能得到 Matrix结果。 最佳答案 您可以使用 Map 函数将 do
我只是没有看到我的错误。关于此错误消息的问题太多了,答案要么不适用,要么我只是看不到它们适用。也许应该改进错误消息? Matrix a = Matrix(3, 4); // fill a with v
在android.opengl.Matrix类中有两种旋转矩阵的方法,它们是: static void rotateM (float[] m, int mOffset, float a, float
我正在使用 C++ 进行编码,并且使用的是 FEniCS fenics/2016.1.0。我的部分代码是 Matrix A; Vector f; std::vector> dirichlet_matr
JAMA(用于矩阵计算的 java 库)中的 JAMA:Matrix.times() 与 Matrix.arrayTimes() 有什么区别 如果我有一个d维度 vector x和一个k维度 vect
我试图做的是简单地将 cublasDgemm(矩阵-矩阵乘法)应用于多个具有“双”(8 字节)类型元素的矩阵,所有这些元素都具有一个非常大的维度。在我的例子中,矩阵的大小是 12755046 x 46
我正在尝试使用 android Matrix 对象旋转给定的位图。 我想将它发送到我的服务器,我正在使用 Android API8。 我应该使用 Matrix.setRotate 还是 Matrix.
我是一名优秀的程序员,十分优秀!