- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有以下 OpenCL 代码,使用 C++ Wrapper 和英特尔的 OpenCL 工具包:
#include <Eigen/StdVector>
...
typedef Sample_t float
typedef std::vector<Sample_t, Eigen::aligned_allocator<Sample_t> > SampleArray;
...
SampleArray data(ns * nt);
...
mdata = cl::Buffer(context, CL_MEM_READ_ONLY, sizeof(Sample_t) * data.size());
queue.enqueueWriteBuffer(mdata, CL_FALSE, 0, sizeof(Sample_t) * data.size(), &data[0]);
当使用 -O3、march=native 和 mtune=native 标志编译时,它会导致来自 TBB 代码的以下段错误:
__memcpy_sse2_unaligned() at memcpy-sse2-unaligned.S:116 0x7ffff6e64ba4
没有任何优化,程序运行良好。
我将问题追溯到 queue.enqueueWriteBuffer 调用,没有它我没有任何问题。
我试图注释掉修改变量“数据”的部分代码,以防我访问无效的内存位置,但问题仍然存在。
如果我从 std::vector 中删除 aligned_allocator,没有优化的构建也会开始中断。
我总共有 70MB 试图存储在此缓冲区中,远小于 CL_DEVICE_MAX_MEM_ALLOC_SIZE 报告的 3.8GB。但是如果我减小数组的大小,问题就会停止。我在后面的案例中尝试的大小是 5。
我还决定打印 vector 分配的地址,它是 0x7f21b797f010,所以它至少对齐到 16 个字节。
编辑:关于多线程,数组的创建以及 OpenCL 操作发生在同一个方法中,并且发生在主线程中。命令队列不是用异步标志创建的,缓冲区写入后有一个 flush() 操作。
可能是什么问题?
谢谢
最佳答案
正如在评论中的对话中确认的那样,这里的问题是 enqueueWriteBuffer()
操作是非阻塞的(CL_FALSE
作为阻塞 参数)并且源缓冲区(SampleArray
vector )在底层复制操作保证完成之前超出范围。
至少有 4 种可能的解决方案:
enqueueWriteBuffer()
的阻塞形式。如文档所示,在这种情况下函数返回后将不会访问源缓冲区。SampleArray()
超出范围之前调用 clWaitForEvents()
或调用 clFinish()
。只有当您的程序在此期间做任何实质性的事情时,这才真正优于阻塞变体。enqueueWriteBuffer()
的复制形式:创建一个带有 NULL 源的缓冲区,将其映射到应用程序的内存空间,将数据写入其中,然后取消映射。这有可能避免完全复制,至少在集成 GPU/APU 上是这样)这些大致按照并行度/效率的递增顺序排列。
关于c++ - OpenCL的enqueueWriteBuffer导致__memcpy_sse2_unaligned segmentation fault,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46615388/
这是一个类作业,用于将有序插入到已排序的链表中。我已经避免访问空指针,并且添加了一些调试输出行以将段错误缩小到 while 循环本身的条件语句。 我可以将一个节点添加到空列表并将具有较小键的节点添加到
一个小型测试程序在 64 位 Linux 上使用 gfortran (4.4.5) 返回段错误。 n=2_8**22_8 时不存在故障。 gdb 指示在循环的第一次迭代期间函数 mylen 中发生段错
我正在使用 Spring-WS,当我通过 webServiceTemplate 中的 marshalSendAndReceive 调用 Web 服务时,我收到错误代码为 500 的 SOAP 错误。不
我有一个具有此方法的单例数据管理器: -(NSArray*)fetchItems { NSEntityDescription *entity = [NSEntityDescription
我有一个调用 Web 服务的 Java 应用程序 (A)。 1)然后我有另一个使用 A jar 的应用程序 (B)。调用成功,返回需要的数据。 2)然后我有一个也使用A jar 的网络应用程序。在这种
我正在 Java 应用程序中对第三方网络服务进行 SOAP 网络服务调用。用于查找 Web 服务、传输数据和发出 SOAP 请求的 Java 类是使用来自 WSDL 的 Apache CXF 库生成的
我正在尝试学习 SOAP 协议(protocol)。因此,在使用以下命令借助 wsimport 生成 net.webservicex 代码后 C:\Program Files\Java\jdk1.8.
我正在构建一个基于配备 arm64 CPU 的 UltraScale+ FPGA 的数据采集系统。数据通过 DMA 传输到 RAM。驱动程序中的 DMA 缓冲区保留如下: virt_buf[i] =
我使用 QtDesigner 创建了两个对话框“listdialog.ui”和“editdialog.ui”,已发布使用Qt5.3.1,然后添加到项目“phone book.pro”“带有源代码”使用
有谁知道空中交通管制系统是如何实现软件容错的? 一些 URL 会很有帮助。 最佳答案 Lockheed 不久前发表了一些关于此的文章。看看here . 许多系统都使用 Ada,它明确支持验证命题和其他
我认为阅读内存应该不会引起任何问题,例如 char *d=""; char *d2="test"; memcmp(d,d2,10); memcmp() 永远 会失败吗? 最佳答案 您的假设是不正确的,
这个程序在我的 UNIX 机器上导致了段错误。我将原因缩小到 memset() 的第二次调用。 为什么会出现这种行为?第一个“ block ”代码与第二个几乎相同,不是吗?为什么 第一次 调用 mem
我很困惑进程在使用虚拟内存时如何可能出现段错误。据我了解,“虚拟”内存允许进程访问所有可用内存,然后将其映射到“实际”硬件内存。通过这种转换,进程怎么可能尝试访问不允许访问的内存部分? 最佳答案 听起
Tritwise操作(向右旋转和疯狂操作)无法正确运行,并在Malbolge编译器/解释器中引发分段错误。 在看到有关Coding Challenges和Code Golf的惊人答案之后,我决定开始在
这是我的代码 #include #include #include /************************************************** a is a poin
我有下面的代码。当我取消注释 temperature(i,j) = anode_temperature 时,我会出现 SegFault。 forall(i=0:Cells(1), j=0:Cells(
我是 C 编程新手,我的代码中出现了段错误。该程序使用返回函数来询问用户他们的银行帐户中有多少钱。稍后我将添加代码来计算利息。感谢您为我查看此内容,因为我很难找出为什么会出现此错误。 #include
为了测试,我编写了一个代码来计算 #include int main(void) { int p, i, primes[50], index; boo
已关闭。此问题需要 debugging details 。目前不接受答案。 编辑问题以包含 desired behavior, a specific problem or error, and the
考虑 const a = [1,2,3] console.log(a[5]) // returns undefined 我是一名 C 和 Fortran 程序员,我预计会发生段错误。这里的内存是如何管
我是一名优秀的程序员,十分优秀!