gpt4 book ai didi

arrays - 将 ArraySlice 与 Accelerate 函数一起使用的更好方法?

转载 作者:可可西里 更新时间:2023-11-01 00:59:08 25 4
gpt4 key购买 nike

我有一些非常大的数组,我必须对其执行数百万次计算。在 Objective-C 中,数组将存储为 NSData,我将它们抽象为 C 数组以在(求和、加等)上使用 Accelerate 函数。然而,(考虑到到处使用指针的明显问题)我喜欢更多地使用 Swift 数组内置的边界检查。因此,我可以使用嵌套的 withUnsafeBufferPointer 来处理两个数组。

func mult(_ x: ArraySlice<Double>, _ y: ArraySlice<Double>) -> [Double] {
assert(x.count == y.count)

var results = [Double](repeating:0, count: x.count)

x.withUnsafeBufferPointer({xBuffer in
y.withUnsafeBufferPointer({yBuffer in
vDSP_vmulD([Double](xBuffer), 1, [Double](yBuffer), 1, &results, 1, vDSP_Length(xBuffer.count))
})
})

return results
}

var testArray = [Double]([0,1,2,3,4,5,6,7,8,9,10])
var testArray2 = [Double]([2,2,2,2,2,2,2,2,2,2,2])

let results = mult(testArray[5...10], testArray2[5...10])
print("\(results)")

首先,当编译器已经知道如何转换 [Double] 本身时,将指针重铸为预期类型似乎很奇怪(在 block 内传递的指针是类型 UnsafeBufferPointer<Double> ,而 vDSP 函数是预期的UnsafePointer<Double>(同样,如果我将数组变量本身传递给它也没有任何提示)。其次,必须嵌套 withUnsafeBufferPointer看起来很奇怪,虽然我明白用法。最后,如果我使用 ArraySlice<Double>作为输入参数类型,那么我无法将函数泛化为 double 组和该数组的一部分。

有更好的方法吗?

最佳答案

  1. 重铸确实是个问题,它创建了一个全新的数组。为避免它,您可以使用 UnsafeBufferbaseAddress 属性(并在 Swift 3 中解包)

  2. 嵌套的withUnsafeBufferPointer 确实是正确的并且无法避免(据我所知)。缓冲区指针仅在闭包内有效。

  3. 您可以为此创建一个协议(protocol)

总而言之,这是您的代码,其中包含这些更改:

import Accelerate

protocol ArrayType {
associatedtype Element
var count : Int { get }
func withUnsafeBufferPointer<R>(_ body: @noescape (UnsafeBufferPointer<Element>) throws -> R) rethrows -> R
}

extension Array : ArrayType {}
extension ArraySlice : ArrayType {}
extension ContiguousArray : ArrayType {}

func mult<A : ArrayType where A.Element == Double>(x: A, y: A) -> [Double] {
assert(x.count == y.count)

var result = [Double](repeating: 0, count: x.count)

x.withUnsafeBufferPointer { x in
y.withUnsafeBufferPointer { y in
vDSP_vmulD(x.baseAddress!, 1, y.baseAddress!, 1, &result, 1, vDSP_Length(x.count))
}
}

return result
}

var testArray1 : [Double] = [0,1,2,3,4,5,6,7,8,9,10]
var testArray2 : [Double] = [2,2,2,2,2,2,2,2,2,2,2]

let results = mult(x: testArray1[5...10], y: testArray2[5...10])
print("\(results)")

强制解包会很好,因为三种一致的类型永远不会给你一个空指针。

关于arrays - 将 ArraySlice 与 Accelerate 函数一起使用的更好方法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38257372/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com