c++ - _mm512_i64gather_pd() 内存访问错误-6ren

c++ - _mm512_i64gather_pd() 内存访问错误

转载作者：行者123 更新时间：2023-11-30 02:17:15

我正在尝试使用一个非常简单的 AVX-512 收集指令示例:

double __attribute__((aligned(64))) array3[17] = {1.0,  2.0,  3.0,  4.0,  5.0,  6.0,  7.0,  8.0,
                     9.0, 10.0, 11.0, 12.0, 13.0, 14.0, 15.0, 16.0,
                    17.0};
int __attribute__((aligned(64))) i_index_ar[16] = {1,  2,  3,  4,  5,  6,  7,  8, 9, 10, 11, 12, 13, 14, 15, 16};
__m512i i_index = _mm512_load_epi64(i_index_ar);
__m512d a7AVX = _mm512_i64gather_pd(i_index, &array3[0], 1);

不幸的是，我最后一次调用 _mm512_i64gather_pd 导致内存访问错误(内存转储)。

德语错误消息:Speicherzugriffsfehler (Speicherabzug geschrieben)

我使用的是英特尔至强融核 (KNL) 7210。

编辑:这里的错误是，我使用 32 位整数和 64 位加载指令，_mm512_i64gather_pd 中的 scale 必须为 8 或 sizeof(double )。

最佳答案

我认为您需要将 scale 设置为 sizeof(double)，而不是 1。

改变:

__m512d a7AVX = _mm512_i64gather_pd(i_index, &array3[0], 1);

到:

__m512d a7AVX = _mm512_i64gather_pd(i_index, &array3[0], sizeof(double));

另请参阅:this question及其答案，以更全面地解释英特尔 SIMD 收集的负载及其用法。

—

另一个问题:你的索引需要是 64 位整数，所以改变:

int __attribute__((aligned(64))) i_index_ar[16] = {1,  2,  3,  4,  5,  6,  7,  8, 9, ...

到:

int64_t __attribute__((aligned(64))) i_index_ar[16] = {1,  2,  3,  4,  5,  6,  7,  8, 9, ...

关于c++ - _mm512_i64gather_pd() 内存访问错误，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/53870705/

文章推荐： java - DL4J UnsatisfiedLinkError : no jniopenblas in java. 库.path

文章推荐： c++ - 是否允许从 CppCon 示例中进行这些编译器优化？

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

c++ - _mm512_i64gather_pd() 内存访问错误