作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试使用一个非常简单的 AVX-512 收集指令示例:
double __attribute__((aligned(64))) array3[17] = {1.0, 2.0, 3.0, 4.0, 5.0, 6.0, 7.0, 8.0,
9.0, 10.0, 11.0, 12.0, 13.0, 14.0, 15.0, 16.0,
17.0};
int __attribute__((aligned(64))) i_index_ar[16] = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16};
__m512i i_index = _mm512_load_epi64(i_index_ar);
__m512d a7AVX = _mm512_i64gather_pd(i_index, &array3[0], 1);
不幸的是,我最后一次调用 _mm512_i64gather_pd
导致内存访问错误(内存转储)。
德语错误消息:Speicherzugriffsfehler (Speicherabzug geschrieben)
我使用的是英特尔至强融核 (KNL) 7210。
编辑:这里的错误是,我使用 32 位整数和 64 位加载指令,_mm512_i64gather_pd
中的 scale 必须为 8 或 sizeof(double )
。
最佳答案
我认为您需要将 scale
设置为 sizeof(double)
,而不是 1。
改变:
__m512d a7AVX = _mm512_i64gather_pd(i_index, &array3[0], 1);
到:
__m512d a7AVX = _mm512_i64gather_pd(i_index, &array3[0], sizeof(double));
另请参阅:this question及其答案,以更全面地解释英特尔 SIMD 收集的负载及其用法。
—
另一个问题:你的索引需要是 64 位整数,所以改变:
int __attribute__((aligned(64))) i_index_ar[16] = {1, 2, 3, 4, 5, 6, 7, 8, 9, ...
到:
int64_t __attribute__((aligned(64))) i_index_ar[16] = {1, 2, 3, 4, 5, 6, 7, 8, 9, ...
关于c++ - _mm512_i64gather_pd() 内存访问错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53870705/
我是一名优秀的程序员,十分优秀!