gpt4 book ai didi

c++ - 关于 Direct2D 绘图调用中的多线程

转载 作者:搜寻专家 更新时间:2023-10-31 01:43:51 25 4
gpt4 key购买 nike

序言

好吧……我知道这个问题可能涉及多个主题,但我对 DirectX 和多线程是全新的,而且我到目前为止阅读的 Stackoverflow+MSDN 文章对我没有任何帮助。因此,我非常感谢将我推向正确方向的每条评论。

前提

几周前我开始编写一个 Direct2D 渲染器,它绘制我放入其中的一些矩阵并在单个窗口中绘制它(顺便说一下,这很好用)。

我试图加快我的计算速度并得到了使用 openMP 的提示。使用 pragma 语句时,我的 progrman 使用 3 个线程而不是一个 - 我想这很好。但我没有注意到任何加速。然而,这不是最糟糕的部分。绘图调用比我计算矩阵占用的时间很多。我不知道如何才能加快速度。

问题

请告诉我应该注意什么或如何加速/多线程我的绘图调用。

注意:我使用的是 STL、Windows 和 DirectX header ,但没有.NET、MFC/ATL 或类似库。

代码示例

vector<dot> set computeMatrix(ushort x, ushort y)
{
// init set
#pragma omp parallel for
for(i=0; i<y; ++i)
for(j=0; j<x; ++j)
//do some computation
return set;
}

dot 是一个 D2D1 椭圆对象。

void draw(vector<dot> set)
{
pRenderTarget->BeginDraw();
pRenderTarget->SetTransform(D2D1::Matrix3x2F::Identity());
#pragma omp parallel for
for(auto coord: set)
{
// set the pBrush
pRenderTarget->FillEllipse(dot, pBrush);
}
pRenderTarget->EndDraw();
}

最佳答案

如果您使用的是 Win8 或更高版本,请确保您已设置 D2D1_DEVICE_CONTEXT_OPTIONS_ENABLE_MULTITHREADED_OPTIMIZATIONS创建 Direct2D 设备上下文时的选项。

When this flag is specified, Direct2D will distribute rendering across all of the logical cores present on the system, which can significantly decrease overall rendering time.

目前,此标志仅适用于几何体,并且需要 HAL。

As of Windows 8.1, this flag only affects path geometry rendering. It has no impact on scenes containing only other primitive types (such as text, bitmaps, or geometry realizations).

This flag also has no impact when rendering in software (i.e. when rendering with a WARP Direct3D device). To control software multithreading, callers should use the D3D11_CREATE_DEVICE_PREVENT_INTERNAL_THREADING_OPTIMIZATIONS flag when creating the WARP Direct3D device.

Specifying this flag can increase peak working set during rendering and can also increase thread contention in applications that already take advantage of multithreaded processing.

您可能还想考虑 geometry realizations .当有大量几何对象要渲染时,我发现这会产生显着差异,但是您必须针对您的场景进行概要分析。椭圆是一种简单的几何体,因此您可能看不到明显的增益,尤其是当您必须转换到渲染位置时。

OpenMP(或任何其他 GPU api)在简单任务上可能会提供更差的性能,因为必须创建“ View ”并将数据复制到 View 或从 View 复制数据。确保您的特定任务受益于使用 OpenMP,并确保您的分析包括上述步骤。

请记住,线程的创建和调度会产生大量开销。通常,通过使代码尽可能简单而不处理调度和同步,您会看到更好的性能。然而,精心规划的线程可以提供巨大的 yield ,尤其是当它们不操作相同的资源(或数据)时。

查看您的渲染过程,并尝试确定您的任何代码是否必须重新计算未更改的任何内容(大小、位置等)。在响应窗口大小更改时执行这些任务。注意您的结构对齐(内存边界)和数据的位置(缓存未命中代价高昂)。希望这会有所帮助。

关于c++ - 关于 Direct2D 绘图调用中的多线程,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24429971/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com