- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我想加速一种算法(具有圆形邻居的完整局部二进制模式),为此我遍历所有像素并用它的邻居计算一些东西(所以我需要邻居像素访问)。
目前,我通过使用一个线程/进程遍历所有像素来实现这一点。我想通过将输入图像分成多个 ROI 并分别计算每个 ROI(使用多个线程)来并行化此任务。
这里的问题是,ROI 是重叠的(因为要计算一个像素,有时我需要看远处的邻居)并且可能有多个线程访问像素数据(阅读)在同一时间。如果两个或多个线程同时读取相同索引的相同 Mat,这是一个问题吗?
如果我并行写入同一个 Mat 但索引不同,这也是一个问题吗?
最佳答案
通常,并行读取不是问题,因为 cv::Mat
只是一个很好的数组包装器,就像 std::vector
(是的,有差异,但我看不出它们会如何影响这里的主题,所以我将忽略它们)。但是,并行化不会自动提升性能。这里有很多事情需要考虑:
创建线程会占用大量资源,如果任务相对较短(就计算时间而言)可能会产生很大的负面影响,因此必须考虑线程池。
如果您编写高性能代码(无论是多线程还是单线程),您应该了解硬件的工作原理。在这种情况下:内存和 CPU。有一个 very good talk来自 CppCon 2016 的 Timur Doumler 关于该主题。这应该可以帮助您避免缓存未命中。
另外值得一提的是编译器优化。打开它。我知道这听起来非常明显,但是 SO 上有很多人询问有关性能的问题,但他们不知道什么是编译器优化。
最后,还有 OpenCV 透明 API (TAPI),它基本上利用 GPU 而不是 CPU。几乎所有 OpenCV 的内置算法都支持 TAPI,您只需传递一个 cv::UMat
而不是 cv::Mat
。这两种类型可以相互转换。但是,转换非常耗时,因为 UMat
基本上是 GPU 内存 (VRAM) 上的一个数组,这意味着每次转换时都必须复制它。访问 VRAM 的时间也比访问 RAM 的时间长(对于 CPU 而言)。但是,您必须记住,如果不将 VRAM 数据复制到 RAM,则无法使用 CPU 访问 VRAM 数据。这意味着如果您使用 cv::UMat
,则无法迭代像素。仅当您编写自己的 OpenCL 或 Cuda 代码以便您的算法可以在 GPU 上运行时才有可能。
在大多数消费级 PC 中,对于滑动窗口算法(基本上是遍历像素并围绕每个像素执行计算的任何算法),使用 GPU 通常是迄今为止最快的方法(但也需要最多的努力来实现) .当然,这仅在数据缓冲区(您的图像)足够大以使其值得复制到 VRAM 和从 VRAM 复制时才成立。
对于平行书写:只要没有重叠区域,通常是安全的。但是,缓存未命中和 false sharing (正如 NathanOliver 所指出的)是需要考虑的问题。
关于c++ - 在 OpenCV 中使用多线程访问 Mat 是线程安全的吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57420290/
我已经彻底搜索过,但没有找到直接的答案。 将 opencv 矩阵 (cv::Mat) 作为参数传递给函数,我们传递的是智能指针。我们对函数内部的输入矩阵所做的任何更改也会改变函数范围之外的矩阵。 我读
是否可以有一个垫子分隔线(一条水平线分隔两个垫子选项)? 我试过: Cars Volvo Saab Mercedes Audi
使用的浏览器 - Chrome 67.0.3396.99 我创建了一个 DialogsModule它有一个组件 ConfirmDialog.component.ts使用以下模板 confirm-dia
我正在尝试使用 mat-toolbar 但出现错误: mat-menu.component.html: Responsive Navigation Menu I
我正在创建 angular 7 网络应用程序,并使用一个 mat-select 下拉菜单和一个 mat-paginator。现在我隐藏 mat-select 向下箭头。 Here is the mat
在我的应用程序中,我有一个通过引用接收 cv::Mat 对象的函数。这是函数的声明: void getChains(cv::Mat &img,std::vector &chains,cv::
我使用了独立的 EMA (1.5.0) 和 eclipse 插件(在 eclipse 4.5 中)来分析我的堆转储。 我想查看任何无法访问的对象信息,我已尝试在我的首选项和命令行选项 -keep_un
我是 flex 的新手,我的垫子 table 做得很好。 不幸的是,我的标题没有遵循我的单元格宽度。 这是我的结果的图片。 如您所见,我的标题与我的单元格不对齐。 这是我的 CSS 代码,就像我说我是
我试图在我的 Material 表上使用 mat-sort 和 mat-paginator,但似乎不起作用。 Table 确实获取了 dataSource.data 中的数据,它也显示在 mat-ta
我试图在我的 Material 表上使用 mat-sort 和 mat-paginator,但似乎不起作用。 Table 确实获取了 dataSource.data 中的数据,它也显示在 mat-ta
我想在每个 mat-option 文本上设置悬停样式,我希望文本显示在 mat-option 之外。为了实现这一点,我应用了非常高的 z-index 值,但没有任何改变。我尝试将 z-index 添加
默认情况下 mat-drawer-container/mat-sidenav-container 和 mat-drawer/mat-sidenav 高度基于 mat-drawer-cont
在 mat-card-header 中提供图像头像通过 mat-card-avatar 得到很好的支持. 在许多用例中,我们希望使用图标而不是图像作为卡片的“头像”。 有没有一种简单的方法可以用图标替
我想要一个包含 2 列的网格列表,并且在这些列中我想要 2 个垂直堆叠的复选框。 我看过 this question 这确实有点 工作,但我想知道是否有更简洁的方法解决这个问题,因为我必须使用大量的
更新:stackbliz https://angular-2wqf4b.stackblitz.io 我正在构建一个比较屏幕,我们可以在其中比较两个项目。我试图将这两项显示为两个 mat-cards里
试图模仿 Material guide 的外观,我无法让工具栏的阴影呈现在 mat-sidenav-container 元素之上: 显示工具栏和 sidenav 的页面,但投影不可见: 单独显示工具栏
请注意,分页/排序无法正常工作。分页不显示它显示的元素数量并且排序不起作用,但是如果您删除 html 文件中的行 *ngIf="dataSource?.filteredData.length > 0"
这个问题在这里已经有了答案: 关闭 10 年前。 Possible Duplicate: Proper stack and heap usage in C++? Heap vs Stack allo
单击每个单选按钮时,我需要为每个垫卡添加背景。背景应仅适用于与单击的垫单选按钮对应的垫卡。
Mat a = (Mat_(3,3) = 2 int dims; //! the number of rows and columns or (-1, -1) when the arr
我是一名优秀的程序员,十分优秀!