gpt4 book ai didi

ios - iOS上的Accelerate框架可以用来画圆吗?

转载 作者:塔克拉玛干 更新时间:2023-11-02 10:08:48 25 4
gpt4 key购买 nike

我正在尝试编写一个 GPUImageFilter 子类来渲染可能有数千个羽毛状圆圈(是的,这是一个笔触)。我目前的方法包括一个绘制大量正方形的 glDrawArrays 调用,以及每个正方形的顶点属性,该属性通知片段着色器每个正方形的质心在哪里,以便着色器可以绘制一个圆,其 alpha 值向边缘逐渐变细(离质心最远)。

除非 (a) 超过 1,000 个圆圈或 (b) 圆圈非常大,否则这在我的测试设备(iPad Mini)上已经足够快了。多边形很快,但着色器速度很快。

我想知道将圆圈直接渲染到字节缓冲区是否会更快,并让 GPUImage(使用 GPUImageRawDataInput)尽可能地获取字节以渲染(通过其他过滤器)到屏幕。

Accelerate 框架是我所知道的在 iOS 上操作字节的最快方式。例如,我发现我可以使用这种方法非常快速地用 vDSP 填充 RGBA 缓冲区:

const int iValue = [RGBA colour as int];

vDSP_vfilli(&iValue, (int*)bytes, 1, width * height);

谁能建议我如何使用 vDSPvImage 函数集将羽化圆圈渲染到我的字节缓冲区中?想到的唯一方法涉及太多的 for 循环以提高性能。

最佳答案

要绘制许多羽化圆,您可能找不到比使用许多四边形和片段着色器更好的方法了。您在这里遇到的性能问题是需要在单个框架中混合任意数量的重叠圆形元素。您不仅要处理大量平行像素,而且还有大量可能会影响每个像素的圆圈。

我在我的 Molecules 应用程序中遇到了类似的问题,并在 this question 中询问了有关调整我的着色器的问题。 .对于分子,我正在绘制棱角分明的球体冒名顶替者,但我仍然需要将数千个或非常大的球体混合在一起。

您可以立即采取一些措施来提高片段着色器的性能(不幸的是,如果没有您正在使用的代码,我只能猜测您是否正在这样做)。首先,如果您的着色器中有分支,请移除分支。使用 step()(在您的情况下很可能是 smoothstep())替换 if 语句。其次,将您可以进行的任何计算转移到顶点着色器。顶点着色器只为你的四边形每个顶点运行一次,而不是你的片段着色器每个像素运行一次。我为四个顶点中的每一个都传入了标准化的 -1,-1 到 1,1 坐标,这使得在我的片段着色器中计算距中心点的距离变得更简单。

禁用混合会大大加快这些设备上的渲染速度,但我认为您无法在此处执行此操作。您可以使用 iOS 6 中新增的帧缓冲区提取操作来做一些巧妙的事情来提高混合性能,但我不确定这是否有帮助。

到目前为止,最大的性能提升将来自尝试减少您需要完成的绘图量。在我的例子中,我能够在我的球体冒名顶替者所在的位置后面绘制一系列不透明的正方形(最后一次迭代中的八边形),并使用深度缓冲区丢弃在任何条件下都不会可见的像素。这导致了 6 倍的性能提升。如果您的圈子的某些部分是不透明的,您也许可以像这样进行预通过。

虽然这是笔触,但在我看来,您应该能够进行更简单的优化,因为您只绘制帧与帧之间发生变化的任何内容。绘制的画笔图像的旧版本可以存储到平面纹理中,该纹理仅使用新的画笔笔划绘制(并再次保存为存储的纹理)。您不需要为每一帧重绘所有画笔笔触,这应该会显着减少您的渲染负载。

关于ios - iOS上的Accelerate框架可以用来画圆吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18884918/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com