- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试在 cython 中使用 openmp。我需要在 cython 中做两件事:
i) 在我的 cython 代码中使用 #pragma omp single{}
作用域。
ii) 使用#pragma omp barrier{}
有人知道如何在 cython 中执行此操作吗?
这里有更多的细节。我有一个 nogil cdef 函数 my_fun()
,我在 omp for 循环中调用它:
from cython.parallel cimport prange
cimport openmp
cdef int i
with nogil:
for i in prange(10,schedule='static', num_threads=10):
my_func(i)
在my_func
里面我需要设置一个barrier等待所有线程 catch ,然后只在其中一个线程中执行一个耗时的操作,并且获得了gil,然后释放屏障,以便所有线程同时恢复。
cdef int my_func(...) nogil:
...
# put a barrier until all threads catch up, e.g. #pragma omp barrier
with gil:
# execute time consuming operation in one thread only, e.g. pragma omp single{}
# remove barrier after the above single thread has finished and continue the operation over all threads in parallel, e.g. #pragma omp barrier
...
最佳答案
Cython 对 openmp 有一些支持,但如果广泛使用 openmp-pragmas,用 C 编写代码并用 Cython 包装结果代码可能更容易。
作为替代方案,您可以使用 verbatim-C 代码和带有定义的技巧来为 Cython 带来一些功能,但是在定义中使用 pragma 并不直接(_Pragma
是 C99-solution , MSVC 一如既往地使用 __pragma
做自己的事情),有一些例子作为 Linux/gcc 的概念证明:
cdef extern from *:
"""
#define START_OMP_PARALLEL_PRAGMA() _Pragma("omp parallel") {
#define END_OMP_PRAGMA() }
#define START_OMP_SINGLE_PRAGMA() _Pragma("omp single") {
#define START_OMP_CRITICAL_PRAGMA() _Pragma("omp critical") {
"""
void START_OMP_PARALLEL_PRAGMA() nogil
void END_OMP_PRAGMA() nogil
void START_OMP_SINGLE_PRAGMA() nogil
void START_OMP_CRITICAL_PRAGMA() nogil
我们让 Cython 相信,START_OMP_PARALLEL_PRAGMA()
和 Co. 是 nogil 函数,因此它将它们放入 C 代码中,从而被预处理器接收。
我们必须使用语法
#pragma omp single{
//do_something
}
不是
#pragma omp single
do_something
因为 Cython 生成 C 代码的方式。
用法可能如下所示(我在这里避免使用 from cython.parallel.parallel
因为它对这个简单的例子来说太神奇了):
%%cython -c=-fopenmp --link-args=-fopenmp
cdef extern from *:# as listed above
...
def test_omp():
cdef int a=0
cdef int b=0
with nogil:
START_OMP_PARALLEL_PRAGMA()
START_OMP_SINGLE_PRAGMA()
a+=1
END_OMP_PRAGMA()
START_OMP_CRITICAL_PRAGMA()
b+=1
END_OMP_PRAGMA() # CRITICAL
END_OMP_PRAGMA() # PARALLEL
print(a,b)
调用 test_omp
在我的机器上使用 2 个线程打印“1 2”,正如预期的那样(可以使用 openmp.omp_set_num_threads(10)
更改线程数)。
但是,上面的代码仍然很脆弱——Cython 的一些错误检查可能会导致无效代码(Cython 使用 goto 来控制流程,并且不可能跳出 openmp-block)。您的示例中会发生这样的事情:
cimport numpy as np
import numpy as np
def test_omp2():
cdef np.int_t[:] a=np.zeros(1,dtype=int)
START_OMP_SINGLE_PRAGMA()
a[0]+=1
END_OMP_PRAGMA()
print(a)
由于边界检查,Cython 将产生:
START_OMP_SINGLE_PRAGMA();
...
//check bounds:
if (unlikely(__pyx_t_6 != -1)) {
__Pyx_RaiseBufferIndexError(__pyx_t_6);
__PYX_ERR(0, 30, __pyx_L1_error) // HERE WE GO A GOTO!
}
...
END_OMP_PRAGMA();
在这种特殊情况下,将 boundcheck 设置为 false,即
cimport cython
@cython.boundscheck(False)
def test_omp2():
...
会解决上述示例的问题,但一般情况下可能不会。
再一次:在 C 中使用 openmp(并用 Cython 包装功能)是一种更愉快的体验。
作为旁注:Python 线程(由 GIL 管理的线程)和 openmp 线程是不同的,彼此之间一无所知。上面的示例也可以在不释放 GIL 的情况下正常工作(编译和运行)——openmp-threads 不关心 GIL,但由于不涉及 Python 对象,所以不会出错。因此,我已将 nogil
添加到包装的“函数”中,因此它也可以在 nogil block 中使用。
然而,当代码变得更复杂时,它变得不那么明显,不同 Python 线程之间共享的变量未被访问(所有这些都是因为这些访问可能发生在生成的 C 代码中,而这并不清楚Cython 代码),在使用 openmp 时不释放 gil 可能更明智。
关于openmp - cython openmp 单,屏障,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57965780/
单向链表 单向链表比顺序结构的线性表最大的好处就是不用保证存放的位置,它只需要用指针去指向下一个元素就能搞定。 单链表图解 图画的比较粗糙,简单的讲解一下: 上面四个长方形,每个长方
使用TCP,我正在设计一些类似于next的程序。 客户端在许多线程中的接收正在等待一台服务器的发送消息。但是,这是有条件的。 recv正在等待特定的发送消息。 例如 客户 thread 1: recv
我正在编写正则表达式来验证电子邮件。唯一让我困惑的是: 顶级域名可以使用单个字符吗?(例如:lockevn.c) 背景:我知道顶级域名可以是 2 个字符到任意字符(.uk、.us 到 .canon、.
是否可以在单个定义中定义同一 Controller 的多个路由? 例如: 我想要一个单一的定义 /, /about, /privacy-policy 使用类似的东西 _home: pat
我正在使用 objective-c开发针对 11.4 iOS 的单 View 应用程序,以及 Xcode版本是 9.4.1。 创建后有Main.storyboard和LaunchScreen.stor
我一直在尝试在 shell 程序中实现管道结构,如果我执行简单的命令(例如“hello | rev”),它就可以工作 但是当我尝试执行“head -c 1000000/dev/urandom | wc
此表包含主机和接口(interface)列UNIQUE 组合* 编辑:这个表也有一个自动递增的唯一 ID,抱歉我应该在之前提到这个 ** | host.... | interface..... |
我想将具有固定补丁大小的“std filter”应用于单 channel 图像。 也就是说,我希望 out[i,j] 等于 img[i,j] 附近的像素值的标准值。 对于那些熟悉 Matlab 的人,
假设我想进行网络调用并使用 rx.Single,因为我希望只有一个值。 我如何应用replay().autoConnect() 这样的东西,这样当我从多个来源订阅时网络调用就不会发生多次?我应该使用
我将图像从 rgb 转换为 YUV。现在我想单独找到亮度 channel 的平均值。你能告诉我如何实现这一目标吗?此外,有没有办法确定图像由多少个 channel 组成? 最佳答案 你可以这样做: #
在比较Go和Scala的语句结束检测时,我发现Scala的规则更丰富,即: A line ending is treated as a semicolon unless one of the foll
在IEEE 1800-2005或更高版本中,&和&&二进制运算符有什么区别?它们相等吗? 我注意到,当a和b的类型为bit时,这些coverpoint定义的行为相同: cp: coverpoint a
我正在使用Flutter的provider软件包。我要实现的是为一个 View 或页面提供一个简单的提供程序。因此,我在小部件中尝试了以下操作: Widget build(BuildContext c
我正在尝试在 cython 中使用 openmp。我需要在 cython 中做两件事: i) 在我的 cython 代码中使用 #pragma omp single{} 作用域。 ii) 使用#pra
我正在尝试从转义字符字符串中删除单引号和双引号。它对单引号 ' 或双自动 " 不起作用。 请问有人可以帮忙吗? var mysting = escapedStr.replace(/^%22/g, '
我正在尝试在 cython 中使用 openmp。我需要在 cython 中做两件事: i) 在我的 cython 代码中使用 #pragma omp single{} 作用域。 ii) 使用#pra
我正在使用 ANT+ 协议(protocol),将智能手机与 ANT+ USB 加密狗连接,该加密狗通过 SimulANT+ 连接到 PC。 SimulANT+ 正在模拟一个心率传感器,它将数据发送到
有人可以解释/理解单/多线程模式下计算结果的不同吗? 这是一个大约的例子。圆周率的计算: #include #include #include const int itera(100000000
我编写了一个粗略的阴影映射实现,它使用 6 个不同的 View 矩阵渲染场景 6 次以创建立方体贴图。 作为优化,我正在尝试使用几何着色器升级到单 channel 方法,但很难从我的着色器获得任何输出
尝试使用 Single-Spa 构建一些东西并面临添加到应用程序 AngularJS 的问题。 Angular2 和 ReactJs 工作完美,但如果添加 AngularJS 并尝试为此应用程序使用
我是一名优秀的程序员,十分优秀!