gpt4 book ai didi

c - 卸载到 MIC (Xeon Phi) 时迭代加载的阵列时出错

转载 作者:行者123 更新时间:2023-11-30 17:01:28 25 4
gpt4 key购买 nike

我在将某些数据结构卸载到 MIC 时遇到问题。

我使用以下指令将负载转移到 MIC:

    #pragma offload target(mic:mic_no)\
inout(is_selected : length(query_sequences_count)ALLOC)\
in(a:length(a_size) ALLOC)\
in(a_disp:length(offload_db_count)ALLOC)

但是,如果我尝试在卸载区域内执行:

//loads next 64 characters of a into datadb
__m512i datadb __attribute__ ((aligned(64)));
datadb = _mm512_load_epi32(a+iter_db+a_disp[j]);

这会导致以下错误:

Offload error:process on the device 0 was terminated by signal 11(SIGSEGV)

但是如果我将 a 的内容复制到另一个数组中,如下所示:

char db[64];
for(window_db_iter = 0; window_db_iter < 64; window_db_iter++)
db[window_db_iter] = *(a+iter_db+a_disp[j]+window_db_iter);

//Now this works fine
datadb = _mm512_load_epi32(db);

我已经检查了 a 卸载的长度是否正确,a_size 是 a 的大小,并且 a_disp 也是正确的。此外,a+iter_db+a_disp[j] 始终保持在内存范围内。我的猜测是,这与将内存复制到 MIC 的过程有关。有什么想法吗?

谢谢!

最佳答案

过了一段时间,我找到了问题的答案。

  • 首先需要对齐数据结构。如果不是,它将返回一个错误。 Offload错误并不意味着错误是在将内存从主机CPU复制到协处理器的过程中引起的,它可能是在代码中的任何地方引起的。

  • 其次,如果您有未对齐的内存并且不能/不想对齐它,您可以在卸载期间使用对齐修饰符,如下所示:

    #pragma offload target(mic:mic_no)\
    inout(is_selected : length(query_sequences_count)ALLOC)\
    in(a[0:a_size]: aligned(64) ALLOC)\
    in(a_disp:length(offload_db_count)ALLOC)

现在复制的内存将被对齐复制。

关于c - 卸载到 MIC (Xeon Phi) 时迭代加载的阵列时出错,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37052171/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com