gpt4 book ai didi

c++ - 加载 vector 到 SSE 寄存器

转载 作者:塔克拉玛干 更新时间:2023-11-03 08:25:14 26 4
gpt4 key购买 nike

我正在尝试将一个 vector 加载到 SSE 寄存器中,我的代码编译没有错误,但是当我尝试运行它时,我遇到了段错误。这是我的代码:

inline int SSEJaccard::calcSSEJaccardDist(unsigned int id1, unsigned int id2) {
int result;
__m128i v, v1;
std::vector<uint32_t> &fv1 = fvs[id1];
std::vector<uint32_t> &fv2 = fvs[id2];
v = _mm_load_si128((__m128i const*) (&fv1));
v1 = _mm_load_si128((__m128i const*) (&fv2));
v = _mm_and_si128(v,v1);
result =_mm_extract_epi16(v, 0) + _mm_extract_epi16(v, 4);
return result;
}

fsv 是一个全局变量,定义如下:

std::vector<std::vector<uint32_t> > fvs;

我正在使用英特尔编译器 (ICC)。谢谢

最佳答案

请注意,您正在将指向 std::vector 的指针传递给内部函数。

相反,您应该传递一个指向所述 vector 包含的数据的指针,例如

v = _mm_load_si128((__m128i const*) (&(fv1[0])));

v1 = _mm_load_si128((__m128i const*) (fv2.data());

std::vector 对象本身只包含一个指针和分配/当前大小信息,而这根本不是 SSE 内在函数所期望的。这也解释了段错误,因为 sizeof(std::vector) 很可能小于 16 个字节(在我的例子中它返回 12)。

当然,对齐应该始终是 SSE 考虑的问题,尽管它可以通过一些巧妙的分配器技巧在 std::vector 上强制执行。 Here is SO question on that topic .

还要确保您的 std::vector 有足够的数据,即 4 个元素(可能更多,如果对齐正确,将被丢弃)

关于c++ - 加载 vector 到 SSE 寄存器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39802418/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com