gpt4 book ai didi

python - OpenCV 函数在由 C++ 线程程序调用的 Python 脚本本身调用时锁定

转载 作者:太空宇宙 更新时间:2023-11-03 23:08:11 24 4
gpt4 key购买 nike

我有一个 C++ 应用程序从多个线程调用 Python 函数。一切正常,直到我尝试使用 Python 中的 OpenCV 函数:

  • 如果在初始化解释器的同一个线程中调用,它工作正常
  • 如果在任何其他 C++ 线程中调用,它将永远锁定,等待互斥体被释放

基本上我有两个文件:

脚本.py:

import cv2

def foo():
print('foo_in')
cv2.imread('sample.jpg')
print('foo_out')

ma​​in.cpp:

#include <pthread.h>
#include <pybind11/embed.h>

pybind11::handle g_main;

void* foo(void*)
{
g_main.attr("foo")();
}

int main()
{
pybind11::scoped_interpreter guard;
pybind11::eval_file("script.py");
g_main = pybind11::module::import("__main__");

foo(nullptr);

pthread_t thread;
pthread_create(&thread, nullptr, &foo, nullptr);
pthread_join(thread, nullptr);

return 0;
}

当我执行 C++ 片段时,我得到:

foo_in
foo_out
foo_in

...然后它就永远卡住了。

如您所见,对 cv2.imread 的第一次调用返回,但第二次调用(在另一个线程中调用的调用)没有返回。

当我 strace 线程 PID 时,我得到以下几行:

futex(0x7fe7e6b3e364, FUTEX_WAIT_BITSET_PRIVATE|FUTEX_CLOCK_REALTIME, 13961, {1550596187, 546432000}, ffffffff) = -1 ETIMEDOUT (Connection timed out)
futex(0x7fe7e6b3e3e0, FUTEX_WAKE_PRIVATE, 1) = 0

...一次又一次地打印,这让我觉得线程正在等待释放互斥量。

我进一步尝试通过使用 gdb 的回溯来了解发生了什么:

#0  pthread_cond_timedwait@@GLIBC_2.3.2 () at ../sysdeps/unix/sysv/linux/x86_64/pthread_cond_timedwait.S:225
#1 0x00007fe7e667948f in ?? () from /usr/lib/x86_64-linux-gnu/libpython3.5m.so.1.0
#2 0x00007fe7e6679979 in PyEval_RestoreThread () from /usr/lib/x86_64-linux-gnu/libpython3.5m.so.1.0
#3 0x00007fe7e669968b in PyGILState_Ensure () from /usr/lib/x86_64-linux-gnu/libpython3.5m.so.1.0
#4 0x00007fe7e3fa7635 in PyEnsureGIL::PyEnsureGIL (this=<synthetic pointer>) at <opencv>/modules/python/src2/cv2.cpp:83
#5 NumpyAllocator::deallocate (this=<optimized out>, u=0x7fe7a80008c0) at <opencv>/modules/python/src2/cv2.cpp:208
#6 0x00007fe7d88e17c2 in cv::MatAllocator::unmap (this=<optimized out>, u=<optimized out>) at <opencv>/modules/core/src/matrix.cpp:18
#7 0x00007fe7e3fa7dc8 in cv::Mat::release (this=0x7fe7ae8018e0) at <opencv>/modules/core/include/opencv2/core/mat.inl.hpp:808
#8 cv::Mat::~Mat (this=0x7fe7ae8018e0, __in_chrg=<optimized out>) at <opencv>/modules/core/include/opencv2/core/mat.inl.hpp:694
#9 pyopencv_from<cv::Mat> (m=...) at <opencv>/modules/python/src2/cv2.cpp:451
#10 0x00007fe7e3faa08c in pyopencv_cv_imread (args=<optimized out>, kw=<optimized out>) at <opencv>/build/modules/python_bindings_generator/pyopencv_generated_funcs.h:10588
#11 0x00007fe7e6575049 in PyCFunction_Call () from /usr/lib/x86_64-linux-gnu/libpython3.5m.so.1.0
#12 0x00007fe7e66811c5 in PyEval_EvalFrameEx () from /usr/lib/x86_64-linux-gnu/libpython3.5m.so.1.0
#13 0x00007fe7e6711cbc in ?? () from /usr/lib/x86_64-linux-gnu/libpython3.5m.so.1.0
#14 0x00007fe7e6711d93 in PyEval_EvalCodeEx () from /usr/lib/x86_64-linux-gnu/libpython3.5m.so.1.0
#15 0x00007fe7e6599ac8 in ?? () from /usr/lib/x86_64-linux-gnu/libpython3.5m.so.1.0
#16 0x00007fe7e664e55e in PyObject_Call () from /usr/lib/x86_64-linux-gnu/libpython3.5m.so.1.0
#17 0x00007fe7e6710947 in PyEval_CallObjectWithKeywords () from /usr/lib/x86_64-linux-gnu/libpython3.5m.so.1.0
#18 0x00000000004369de in pybind11::detail::simple_collector<(pybind11::return_value_policy)1>::call (this=0x7fe7ae801e80, ptr=0x7fe7e6eaef28) at <pybind11>/pybind11/cast.h:1953
#19 0x00000000004334f3 in pybind11::detail::object_api<pybind11::detail::accessor<pybind11::detail::accessor_policies::str_attr> >::operator()<(pybind11::return_value_policy)1> (this=0x7fe7ae801ed0)
at <pybind11>/pybind11/cast.h:2108
#20 0x0000000000424336 in foo () at main.cpp:11

我尝试将 python 解释器初始化移动到 foo 函数中,然后它起作用了(我只需要删除对 foo 的第一次调用,因为解释器只能被初始化每个应用程序一次)。

这让我觉得 cv2.imread 函数只有在解释器初始化的同一线程中调用时才会返回。

如果我用任何其他 OpenCV 函数替换对 cv2.imread 的调用,也会发生同样的情况。我在 cv2.imwritecv2.projectPoints 上测试了它。

知道发生了什么以及如何在仍然能够从不同线程调用 OpenCV 函数的同时绕过它吗?

最佳答案

原来问题是我在没有持有 GIL(全局解释器锁)的情况下使用 Python 指令。 GIL 首先由初始化解释器的线程持有,必须在其他线程获取它之前显式释放。

执行锁定在 cv2.imread 指令而不是 print('foo_in') 指令的原因是 Python 解释器无法确保它持有从 C++ 调用时的 GIL(这意味着任何纯 Python 指令都以线程不安全的方式执行)。然而,由 cv2.* 指令调用的 C++ 代码在后台确实确保它在执行之前持有 GIL,因此锁定。

我使用明确的 GIL 发布和获取解决了这个问题:

main.cpp

#include <pthread.h>
#include <pybind11/embed.h>

pybind11::handle g_main;

void* foo(void*)
{
pybind11::gil_scoped_acquire gil;
g_main.attr("foo")();
}

int main()
{
pybind11::scoped_interpreter guard;
pybind11::eval_file("../script.py");
g_main = pybind11::module::import("__main__");
pybind11::gil_scoped_release nogil;

foo(nullptr);

pthread_t thread;
pthread_create(&thread, nullptr, &foo, nullptr);
pthread_join(thread, nullptr);

return 0;
}

现在一切正常,我确实得到了预期的输出:

foo_in
foo_out
foo_in
foo_out

关于python - OpenCV 函数在由 C++ 线程程序调用的 Python 脚本本身调用时锁定,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54772595/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com