gpt4 book ai didi

Java/Open CL/Aparapi : What to kind of performance to expect from which device?

转载 作者:行者123 更新时间:2023-11-30 04:12:29 25 4
gpt4 key购买 nike

为了大致了解 openCl 对我的帮助有多大,我进行了矩阵-矩阵乘法的测试,因为这种基本的线性代数将是我的主要用途。我使用的代码可以在这里找到:http://vasanthexperiments.wordpress.com/2011/11/20/aparapi-java-matrix-multiplication-example/ 。 (1024*1024 x 1024*1024矩阵-矩阵乘积)

基本上,我对结果感到非常失望,因为与 CPU 上的串行计算相比,加速只是微不足道的(小于 x2),如果我让 Aparapi 使用 CPU(它并行化),CPU 甚至更快。
在执行过程中,显卡处于满负载状态,所以我认为应该不会出现通信问题。

我的硬件配置:
i7 2670QM
AMD 7610M
16GB 内存

由于我对 GPGPU 完全陌生,所以我不知道会发生什么。
1. 我的设置是否有可能被搞砸了?如果是这样,我应该去哪里寻找?
2. 或者我只是对入门级显卡期望太高?如果是这样,不同型号的显卡如何应对此类问题?如果我想获得更快的硬件,我必须寻找哪些规范?

编辑:

好的,所以我只是用 10x10 矩阵重新运行该程序。
毫不奇怪,CPU 需要的时间不到 1 毫秒。
然而,GPU 需要超过 1600,所以 Aparapi 或 openCL 或我的硬件肯定有问题(驱动程序应该是最新的)。有人知道我应该去哪里看吗?

最佳答案

比较的部分问题在于,您将低端移动 GPU 与优质移动 CPU 进行比较。 GPU 的单精度速度大约是 CPU 的 2 倍,并且它们的内存带宽相似。这些是您需要仔细查看的两个规范。

上次我检查线性代数例程时,它们能够获得 GPU 峰值浮点速度的大约 60%。维基百科 here 列出了当前所有 AMD 和 Nvidia GPU 的速度和 here 。您还需要使用较新的 GPU,而不是较旧的 GPU。

关于Java/Open CL/Aparapi : What to kind of performance to expect from which device?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19279344/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com