- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
我正在学习 openMP,并以我有限的知识并行化了我的代码。我正在尝试使用 openMP 矢量化技术改进此代码。但是在阅读相关阅读 Material (link)时,我发现无法对 long double 数据类型进行矢量化操作。有人可以提供有关为什么会这样的信息并提出除降低精度之外的解决方案吗?
链接中的内容如下:“避免在 SIMD 硬件中不支持的操作。在 Linux 上使用(80 位)long double 的算术运算和余数运算符“%”是 SIMD 硬件中不支持的操作示例。”
附言我正在使用 INTEL C++ 编译器 16.0.2、具有 128 位长 vector 寄存器的 INTEL XEON 处理器和 Linux。我的数据类型大多是 long double。
最佳答案
x86 指令集的 SIMD 指令仅支持 32 位和 64 位浮点运算(对 16 位 float 的支持有限)。此外,即使有 64 位乘以 64 位到 128 位标量整数指令(例如 mulx
),也没有相应的 SIMD 指令。许多人已经尝试并未能实现高效的 128 位整数 x86 SIMD 算法(multiplication 和可能的 addition 有一些异常(exception))。没有通用的 x86 SIMD 整数除法指令。
但是,对于浮点,人们使用 double-double 进行更高精度的浮点 SIMD 运算取得了更大的成功。 . Double-double 具有 106 位精度,而 80 位 long double 具有 64 位精度。但并非每个 C++ 编译器都使用 80 位 long double。有些只使用只有 54 位精度的 double (例如 MSVC),有些使用具有 113 位精度的 128 位四精度,维基百科甚至声称一些编译器将 long double 实现为 double-double。
我描述了双双的一些细节here .请注意,double-double 不是 IEEE 浮点类型,它有一些不寻常的属性。此外,double-double 的范围与 double 相同,因此它只会提高精度。
与 long double 相比,double-double 的速度有多快?我从来没有测试过这个。但我发现,在进行乘法和加法运算的平衡混合时,double-double 比 double 运算慢大约 10 倍。 long double 肯定比 double 慢(除非它被实现为 double)。但是由于您可以将 SIMD 与 double-double 一起使用,但不能与内置的 long double 一起使用,因此速度会与 SIMD 宽度成比例地提高。因此,使用 SSE2 进行 2 次双重操作,使用 AVX 进行 4 次操作,使用 AVX512 进行 8 次操作。
不过不要指望 OpenMP 的 simd
构造能够实现 double 。您需要自己实现或查找库。
关于c++ - 不能对 long double 数据类型进行 openMP 矢量化操作吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37109647/
下面的代码有效,我觉得double(double)和double(*)(double)没有区别,square和 &square,我说得对吗? #include double square(doubl
我知道我的作业很草率,这是我在这门课上的第 4 次作业。任何帮助将不胜感激,谢谢。 double getPrincipal(0); double getRate(0); double getYe
我遇到了那个错误,当我使用类时,我在使用函数指针时遇到了这个错误。我的函数'ope'函数我该如何解决 evaluator::function(){ double (*ope) (dou
问题://故事从哪里开始 Graphics 类型中的方法 drawLine(int, int, int, int) 不适用于参数 (double, double, double, double) g.
我有一张 map> m1 形式的 map .我可以将其复制到 map m2 形式的 map 吗?这样键是相同的,并且 m2 中的值是 get(m1->second) 不使用循环?谢谢! 最佳答案 这样
有没有办法获取vector> 的“.first”和“.second”的连续内存? ?我的意思是: void func(int N, double* x, double* y) { for (i
我正在尝试将自定义 lambda 传递给需要函数指针的函数(更准确地说是 zero 中的 Brent library 函数)。 我的想法是,我将使用参数创建一次 lambda,然后用多个值对其求值 x
这是一个很简单的问题,让我很困惑。 我收到一个源文件的以下错误,但另一个没有: 4 src/Source2.cpp:1466: error: no matching function for cal
struct CalculatorBrain { private var accumulator: Double? func changeSign(operand: Double) -
在我正在进行的项目中,我尝试使用 curlpp库来发出一个简单的 html GET 请求。当我将 cpp 文件传递给 g++ 时,出现以下错误: /usr/local/include/curlpp
不使用double就能获得quadruple精度超过16位的数字吗?如果可能的话,这取决于编译器还是其他?因为我知道有人说他使用double精度,并且具有22位精度。 最佳答案 数据类型double
我正在寻找有关特斯拉 GPU 中硬件如何实现 double 的信息。我读到,两个流处理器正在处理单个 double 值,但我没有找到 nvidia 的任何官方论文。 提前致谢。聚苯硫醚为什么大多数 G
这个问题在这里已经有了答案: Passing capturing lambda as function pointer (10 个答案) 关闭 2 年前。 我有这个错误 error: cannot
情况:我有一个元组列表,其中添加了一个元组: List> list = new List>(); list .Add(new Tuple(2.2, 6.6)); 一切似乎都还好。但是......在 D
我有一个 JList,里面有一堆名字,还有一个包含这些名字值的数组 final Double[] filmcost = { 5.00, 5.50, 7.00, 6.00, 5.00 }; 我想做的是,
我试图找出牛顿法来求方程的根。这个错误出来了,我无法处理。 double fn(double n){ return sin(n)+log(n)-1; } double f1n(double n
我有一个 junit 测试断言两个 Double 对象,具有以下内容: Assert.assertEquals(Double expected, Double result); 这很好,然后我决定将其
我正在尝试引入部分数据文件来填充数组,用户尝试了三次输入正确的数据文件名。我一再遇到这些错误。我知道像 arr 这样的数组只是一个指向内存块的指针。 #include #include #incl
我正在尝试完成复习题(为即将到来的编程决赛),但是,我无法解决这个问题,因为我不断收到错误(标题)。正如预期的那样,我将发布问题和我尝试的解决方案。 问题: 给定以下函数定义:void swap(do
任何人都知道如何实现这一目标。我已经尝试了通常的公式,但我只得到正数 Double.NEGATIVE_INFINITY) return d; } } 这将以相同的概率
我是一名优秀的程序员,十分优秀!