c++ - 将视频帧数据移动到 GPU 的最有效方法是什么？-6ren

c++ - 将视频帧数据移动到 GPU 的最有效方法是什么？

转载作者：塔克拉玛干更新时间：2023-11-03 06:51:06

26

4

我目前正在我的 GPU (CUDA/C++) 上实现运动跟踪算法，到目前为止我看到了非常强劲的加速。然而，正如人们可能预料的那样，主要瓶颈是帧(图像)数据从 CPU 到 GPU 的实际传输。

照原样，我正在使用 OpenCV 读取测试视频文件。然而，OpenCV 以 RRGGBB RRGGBB ... 的形式将帧作为打包字节返回，或者换句话说，每个像素都与 24 位边界对齐。这不允许我使用 union 内存访问，这会对 GPU 造成严重的性能损失。按原样，我只是使用一些预先生成的测试数据，这些数据 32 位对齐(以 RRGGBB00 RRGGBB00 ... 形式填充零)，但是我现在想开始使用实际的视频数据。

这导致了一些严重的性能损失，所以我有两个主要问题:

虽然我可以在 CPU 上手动预处理感兴趣的像素然后启动传输，但有没有什么方法可以快速将像素数据传输到 GPU，而不是对齐到 32 位边界？ (不过，我认为这与预处理具有相同的性能影响)
我可以使用另一个库来读取不同格式的视频吗？例如，我知道 SDL 表面被打包在 32 位边界内，即使不包含 alpha channel 也是如此。

我们实现的最终目标是与用于机器人控制的摄像头进行实时交互，尽管现在我只想要一些可以有效解码我的测试视频的东西，以测试我们的特征检测和运动跟踪算法定义测试数据。

最佳答案

我尝试编写一个简单的 CUDA 内核，使用共享内存将 24 位值填充为 32 位值。请注意，这不是一个非常整洁的代码(仅适用于 1 个 block ，依赖 int 为 32 位)- 小心使用。我尝试了一个有共享内存原子和没有共享内存原子的版本 - 似乎工作。:

__global__ void pad(unsigned int *data, unsigned int* odata) {
__shared__ unsigned int array[WORK_SIZE];
unsigned int v, high, low;
const int index = (threadIdx.x * sizeof(unsigned int)) / 3;

array[threadIdx.x] = 0;
__syncthreads();

const int shl = threadIdx.x % 3;
const int shr = 3 - shl;

if (threadIdx.x
        < ((WORK_SIZE * 3) + sizeof(unsigned int) - 1)
                / sizeof(unsigned int)) {
    v = data[threadIdx.x];
    high = (v >> (shl * 8)) & ~0xFF;
    low = v << (shr * 8);
#if __CUDA_ARCH__ < 200
    array[index] = high;
}
__syncthreads();
if (threadIdx.x
        < ((WORK_SIZE * 3) + sizeof(unsigned int) - 1)
        / sizeof(unsigned int)) {
    array[index + 1] += low;
#else
    if (high)
        atomicOr(array + index, high);
    if (low)
        atomicOr(array + 1 + index, low);
#endif
}
__syncthreads();

// Do computations!
odata[threadIdx.x] = array[threadIdx.x] + 0xFF;
}

关于c++ - 将视频帧数据移动到 GPU 的最有效方法是什么？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/15787898/

26

4

0

文章推荐： c++ - Python和C++的两种通信方式

文章推荐： c++ pointer vector put derived class but sliced 打印

html - 移动 HTML5 框架 - Jquery 移动
只是想知道 Jquery Mobile 是否足够稳定以用于实时生产企业移动应用程序。有很多 HTML5 框架，因为我们的团队使用 JQuery 已经有一段时间了，我们更愿意使用 Jquery 移动框
node.js - PUBG 移动 api - 是否存在任何返回用户信息的 pubg 移动 api
关闭。这个问题需要details or clarity .它目前不接受答案。想改进这个问题吗？通过 editing this post 添加细节并澄清问题. 关闭 3 年前。 Improve t
javascript - javascript 中的拖放 - 元素可以按 x 移动，但不能按 y 移动？
所以我尝试在 JavaScript 中对元素进行拖放。我使用的视频教程在这里； https://www.youtube.com/watch?v=KTlZ4Hs5h80 。我已经按照它的说明进行了编码，
javascript - 移动 iOS 设备(移动 Chrome 和 Safari)上的 mp3 音频缓存问题
无法在移动 iOS(safari 和 chrome)上自动播放以前缓存的 mp3 音频我正在 Angular 8 中开发一个应用程序，在该应用程序的一部分中，我试图在对象数组中缓存几个传入的音频 m
Git如何检测整个文件夹已删除/移动
Git 基于内容而不是文件，所以我目前理解以下行为，但我想知道是否有特殊选项或 hack 来检测此类事情: git init mkdir -p foo/bar echo "test" foo/a.tx
移动 View 的语义ui隐藏元素
我正在寻找语义 ui 正确的类来隐藏例如移动 View 中的 DIV。在 Bootstrap 中，我们有“visible-xs”和“hidden-xs”。但是在语义ui上我只找到了“仅移动网格” 最
linux - 移动，复制文件而不使用太多内存
我正在使用 ubuntu 和想要移动或复制大文件。但是当我与其他人一起使用服务器时，我不想拥有所有内存并使其他进程几乎停止。那么有没有办法在内存使用受限的情况下移动或复制文件？最佳答案如果你
集会？ LD & 移动
这些指令有什么区别？以 ARM9 处理器为例，它不应该是: ASM: mov r0, 0 C: r0 = 0; ASM: ld r0, 0 C: r0 = 0; ? 我不知道为什么要使用一个或另一个:
php - 移动/复制和重命名最近修改的文件
我有一个文件夹，其中包含一些随机命名的文件，其中包含我需要的数据。为了使用数据，我必须将文件移动到另一个文件夹并将文件命名为“file1.xml” 每次移动和重命名文件时，它都会替换目标文件夹中以前
xcode - 移动 Storyboard中其他对象后面的对象
我经常在 IB/Storyboard 中堆叠对象，几乎不可能拖动其他对象后面的对象而不移动前面的对象。无论如何我可以移动已经选择但位于其他对象后面的对象吗？当我尝试移动它时，它总是选择顶部的对象，还是
移动 Safari 推送通知
几个月前，我看到 Safari 7 允许推送通知，它似乎是一个非常有用的工具，除了我看到的每个示例都专注于桌面浏览，而不是移动设备。 Safari 推送通知是否可以在移动设备上运行，如果没有，是否有计
c# - 移动/调整窗口大小时任务被阻止
我有一个简单的 View 模型，其中包含修改后的 ObservableCollection使用 SynchronizationContext.Current.Send在 UI 线程上执行对集合的更改。
Cassandra 移动 data_file_firectories
关于cassandra创建的数据文件和系统文件的位置，我需要移动在“cassandra.yaml”配置文件中设置的“commitlog_directory”、“data_file_directorie
javascript - 如何将浏览器选项卡标题设置为滚动/移动？
我有这个代码 $(function() { var message = 'Dont forget us'; var original; var txt1 = ' - '; $(wind
html - 页面底部奇怪的空白(移动)
我的客户报告说他的网站有一个奇怪的问题。该网站的 URL 是 your-montenegro.me 在基于 Android 的浏览器上加载时，页面底部会出现一个奇怪的空白区域。以下是屏幕截图: 华
javascript - 移动|克隆元素并从原始位置删除
我有这个 HTML 标记: Express 300 bsf Sign Up 我需要将元素从 DOM 上的一个
uitableview - 确定表格单元格何时开始在可能的移动操作中拖动(移动)
我有一个可重新排序的 TableView (UITableView 实例)。尽管我已经实现了 UITableViewDataSource 方法: tableView:moveRowAtIndexPat
html - 页面底部奇怪的空白(移动)
我的客户报告说他的网站有一个奇怪的问题。该网站的 URL 是 your-montenegro.me 在基于 Android 的浏览器上加载时，页面底部会出现一个奇怪的空白区域。以下是屏幕截图: 华
java - 如何区分importData中的复制/移动
我需要在拖放或复制/剪切和粘贴(复制与移动)期间获取操作类型。它是一个 Swing 应用程序，并且实现了 TransferHandle。我在操作结束时需要此信息，在 importData 方法中。对
java - 移动 ArrayList
我编写了一个具有 add 和 get 方法的 SortedIntList 类。我调用以下四个方法: SortedIntList mySortedIntList = new SortedIntList

首页

博学

6Ren·AI

商城

c++ - 将视频帧数据移动到 GPU 的最有效方法是什么？