gpt4 book ai didi

无法将 float 组读入 __m128

转载 作者:太空宇宙 更新时间:2023-11-04 04:49:50 26 4
gpt4 key购买 nike

我正在摆弄矢量化(初学者)。它的重点是看我是否可以展开一个循环。我喜欢像这样加载四个连续的 float ,请参阅段错误。

el0 = _mm_load_ps(&array[0]);
el1 = _mm_load_ps(&array[1]); // Seg fault

我明白为什么会出现段错误。我的问题是,有没有一种带有偏移量的 _mm_loading 的巧妙方法?

最佳答案

评论者已经解决了它,但是当问题出现在未回答的问题列表中时,这很烦人。

_mm_load_ps(&array[0])   // load a vector of array[0..3]
_mm_load_ps(&array[1]) // load a vector of array[1..4]. different alignment than array[0]

// what you probably want is:
_mm_load_ps(&array[4]) // load a vector of array[4..7], aligned if array is aligned

索引步幅应为 sizeof(vector_type)/sizeof(array[0])。 (然后当您为 AVX 扩展代码时,您不必更改索引。)

关于无法将 float 组读入 __m128,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16694817/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com