- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
在 CPU 端,我有一个要传递给计算内核的结构:
private struct BoundingBoxParameters {
var x: Float = 0
var y: Float = 0
var width: Float = 0
var height: Float = 0
var levelOfDetail: Float = 1.0
var dummy: Float = 1.0 // Needed for success
}
在运行内核之前,我将数据传递给 MTLComputeCommandEncoder:
选项 1(直接):
commandEncoder!.setBytes(¶ms, length: MemoryLayout<BoundingBoxParameters>.size, index: 0)
选项 2(间接通过 MTLBuffer):
boundingBoxBuffer.contents().copyBytes(from: ¶ms, count: MemoryLayout<BoundingBoxParameters>.size)
commandEncoder!.setBuffer(boundingBoxBuffer, offset: 0, index: 0)
如果结构中存在“虚拟”变量,则任一选项都可以正常工作,但如果“虚拟”变量不存在,则会失败。代码调用失败:
commandEncoder!.dispatchThreadgroups(threadGroups, threadsPerThreadgroup: threadGroupCount)
出现错误:
validateComputeFunctionArguments:820: failed assertion `Compute Function(resizeImage): argument params[0] from buffer(0) with offset(0) and length(20) has space for 20 bytes, but argument has a length(24).'
在 Metal Kernel 方面,这里是相关的代码片段:
struct BoundingBoxParameters {
float2 topLeft;
float2 size;
float levelOfDetail;
};
kernel void resizeImage(constant BoundingBoxParameters *params [[buffer(0)]],
texture2d<half, access::sample> sourceTexture [[texture(0)]],
texture2d<half, access::write> destTexture [[texture(1)]],
sampler samp [[sampler(0)]],
uint2 gridPosition [[thread_position_in_grid]]) {
float2 destSize = float2(destTexture.get_width(0), destTexture.get_height(0));
float2 sourceCoords = float2(gridPosition) / destSize;
sourceCoords *= params->size;
sourceCoords += params->topLeft;
float lod = params->levelOfDetail;
half4 color = sourceTexture.sample(samp, sourceCoords, level(lod));
destTexture.write(color, gridPosition);
}
尝试将 3x3 矩阵传递给另一个计算内核时,我也遇到了类似的问题。它提示提供了 36 个字节,但期望是 48 个字节。
有人对这个问题有任何想法吗?
最佳答案
首先,我想指出你不应该使用 size
当您需要获取内存中布局的 Swift 类型的实际长度时。你应该使用 stride
为了那个原因。根据 Swift 的 Type Layout :
The final size and alignment are the size and alignment of the aggregate. The stride of the type is the final size rounded up to alignment.
This answer如果您想更好地理解该主题,请详细了解 Swift 中的内存布局。
问题是你的 Metal struct
使用float2
和一个 Swift struct
用两个单独的 Float
代替它字段具有不同的内存布局。
结构的大小(在 Swift 的情况下为步长)需要是任何结构成员的最大对齐的倍数。 Metal struct
中最大的对齐方式是 8 个字节(float2
的对齐方式)所以在 float
之后的结构尾部有一个填充值(value)。
struct BoundingBoxParameters {
float2 topLeft; // 8 bytes
float2 size; // 8 bytes
float levelOfDetail; // 4 bytes
// 4 bytes of padding so that size of struct is multiple
// of the largest alignment (which is 8 bytes)
}; // 24 bytes in total
所以你的 Metal struct
实际上最终占用了 24 个字节,正如错误提示的那样。
同时,您的Swift struct
,具有4字节的最大对齐,只需要20字节。
private struct BoundingBoxParameters {
var x: Float = 0 // 4 bytes
var y: Float = 0 // 4 bytes
var width: Float = 0 // 4 bytes
var height: Float = 0 // 4 bytes
var levelOfDetail: Float = 1.0 // 4 bytes
// no need for any padding
} // 20 bytes in total
这就是为什么它们最终彼此不兼容并且dummy
字段补偿 4 个丢失的字节 到 Swift struct
.
要解决此问题,我建议您使用 float2
来自 simd
在 Swift 中而不是 Float
小号:
import simd
private struct BoundingBoxParameters {
var topLeft = float2(x: 0, y: 0)
var size = float2(x: 0, y: 0)
var levelOfDetail: Float = 1.0
}
不要忘记使用MemoryLayout<BoundingBoxParameters>.stride
(24 字节) 来获取长度而不是 size
(20 字节)。
同样适用于 3x3 矩阵情况:Metal 的 float3x3
大小为 48 字节,对齐方式为 16 字节。正如我假设的那样,您已经创建了一个 Swift struct
与 9 Float
s 的步幅/大小为 36 字节,对齐方式为 4 字节。因此,错位。使用 matrix_float3x3
来自 simd
.
一般来说,对于在 Metal 中使用向量或矩阵的任何情况,你应该使用相应的 simd
在 Swift 中输入。
关于image-processing - 使用 Swift 4 在 Metal Compute Kernel 中传递参数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48724118/
Github:https://github.com/jjvang/PassIntentDemo 我一直在关注有关按 Intent 传递对象的教程:https://www.javacodegeeks.c
我有一个 View ,其中包含自动生成的 text 类型的 input 框。当我单击“通过电子邮件发送结果”按钮时,代码会将您带到 CalculatedResults Controller 中的 Em
我有一个基本的docker镜像,我将以此为基础构建自己的镜像。我没有基础镜像的Dockerfile。 基本上,基本镜像使用两个--env arg,一个接受其许可证,一个选择在容器中激活哪个框架。我可以
假设我想计算 2^n 的总和,n 范围从 0 到 100。我可以编写以下内容: seq { 0 .. 100 } |> Seq.sumBy ((**) 2I) 但是,这与 (*) 或其他运算符/函数不
我有这个网址: http://www.example.com/get_url.php?ID=100&Link=http://www.test.com/page.php?l=1&m=7 当我打印 $_G
我想将 window.URL.createObjectURL(file) 创建的地址传递给 dancer.js 但我得到 GET blob:http%3A//localhost/b847c5cd-aa
我想知道如何将 typedef 传递给函数。例如: typedef int box[3][3]; box empty, *board[3][3]; 我如何将 board 传递给函数?我
我正在将一些代码从我的 Controller 移动到核心数据应用程序中的模型。 我编写了一个方法,该方法为我定期发出的特定获取请求返回 NSManagedObjectID。 + (NSManagedO
为什么我不能将类型化数组传递到采用 any[] 的函数/构造函数中? typedArray = new MyType[ ... ]; items = new ko.observableArray(ty
我是一名新的 Web 开发人员,正在学习 html5 和 javascript。 我有一个带有“选项卡”的网页,可以使网页的某些部分消失并重新出现。 链接如下: HOME 和 JavaScript 函
我试图将对函数的引用作为参数传递 很难解释 我会写一些伪代码示例 (calling function) function(hello()); function(pass) { if this =
我在尝试调用我正在创建的 C# 项目中的函数时遇到以下错误: System.Runtime.InteropServices.COMException: Operation is not allowed
使用 ksh。尝试重用当前脚本而不修改它,基本上可以归结为如下内容: `expr 5 $1 $2` 如何将乘法命令 (*) 作为参数 $1 传递? 我首先尝试使用“*”,甚至是\*,但没有用。我尝试
我一直在研究“Play for Java”这本书,这本书非常棒。我对 Java 还是很陌生,但我一直在关注这些示例,我有点卡在第 3 章上了。可以在此处找到代码:Play for Java on Gi
我知道 Javascript 中的对象是通过引用复制/传递的。但是函数呢? 当我跳到一些令人困惑的地方时,我正在尝试这段代码。这是代码片段: x = function() { console.log(
我希望能够像这样传递参数: fn(a>=b) or fn(a!=b) 我在 DjangoORM 和 SQLAlchemy 中看到了这种行为,但我不知道如何实现它。 最佳答案 ORM 使用 specia
在我的 Angular 项目中,我最近将 rxjs 升级到版本 6。现在,来自 npm 的模块(在 node_modules 文件夹内)由于一些破坏性更改而失败(旧的进口不再有效)。我为我的代码调整了
这个问题在这里已经有了答案: The issue of * in Command line argument (6 个答案) 关闭 3 年前。 我正在编写一个关于反向波兰表示法的 C 程序,它通过命
$(document).ready(function() { function GetDeals() { alert($(this).attr("id")); } $('.filter
下面是一个例子: 复制代码 代码如下: use strict; #这里是两个数组 my @i =('1','2','3'); my @j =('a','b','c'); &n
我是一名优秀的程序员,十分优秀!