gpt4 book ai didi

performance - 即使使用 -Ofast,Swift 的字典也很慢

转载 作者:可可西里 更新时间:2023-11-01 01:06:51 25 4
gpt4 key购买 nike

我在 Swift 中使用 Dictionary 实现本质上是缓存。性能远低于我的预期。我读过其他一些问题,例如 this one about array sorting这似乎表明 -Ofast 是答案(如果您准备好接受它带来的变化)。然而,即使编译 -Ofast,性能也比不上其他语言。我使用的是 Swift 版本 1.0 (swift-600.0.34.4.8)。

以下是说明问题的简化示例:

import Foundation

class Holder {
var dictionary = Dictionary<Int, Int>()

func store(#key: Int, value: Int) {
dictionary[key] = value
}
}

let holder = Holder()

let items = 5000

for (var i: Int = 0; i < 5000; i++) {
holder.store(key: i, value: i)
}

-O3编译运行需要两秒以上:

xcrun swift -sdk $(xcrun --show-sdk-path --sdk macosx) -O3 Test.swift && time ./Test

real 0m2.295s
user 0m2.176s
sys 0m0.117s

使用 -Ofast 编译会产生 3-4 倍的改进:

xcrun swift -sdk $(xcrun --show-sdk-path --sdk macosx) -Ofast Test.swift && time ./Test

real 0m0.602s
user 0m0.484s
sys 0m0.117s

相比之下,这个 Java 实现:

import java.util.Map;
import java.util.HashMap;

public class Test {
public static void main(String[] args) {
Holder holder = new Holder();
int items = 5000;
for (int i = 0; i < items; i++) {
holder.store(i, i);
}
}
}

class Holder {
private final Map<Integer, Integer> map = new HashMap<Integer, Integer>();

public void store(Integer key, Integer value) {
map.put(key, value);
}
}

又快了 6 倍:

javac Test.java && time java Test

real 0m0.096s
user 0m0.088s
sys 0m0.021s

是否仅仅是复制 Dictionary 的成本导致 Swift 表现如此糟糕?删除 Holder 并直接访问 Dictionary 会提示它是。

这段代码:

import Foundation

var dictionary = Dictionary<Int, Int>()

let items = 5000

for (var i: Int = 0; i < 5000; i++) {
dictionary[i] = i
}

显着更快:

$ xcrun swift -sdk $(xcrun --show-sdk-path --sdk macosx) -O3 NoHolder.swift && time ./NoHolder

real 0m0.011s
user 0m0.009s
sys 0m0.002s

$ xcrun swift -sdk $(xcrun --show-sdk-path --sdk macosx) -Ofast NoHolder.swift && time ./NoHolder

real 0m0.011s
user 0m0.007s
sys 0m0.003s

虽然它提供了一个(希望如此)有趣的数据点,但在我的情况下无法直接访问字典。我还能做些什么来使当前形式的 Swift 更接近这种性能水平?

最佳答案

TL;DR 这是测试版。

我认为现在的答案只是 Swift 处于测试阶段,工具处于测试阶段,还有很多优化尚未完成。在 Obj-C 中复制您的“Holder”类示例表明,即使它在相同的 -Ofast 级别上也快得多。

@import Foundation;

@interface Holder : NSObject

@property NSMutableDictionary *dictionary;
- (void)storeValue:(NSInteger)value forKey:(NSString *)key;

@end

@implementation Holder

- (instancetype)init {
self = [self initWithDict];
return self;
}


- (instancetype)initWithDict {
if (!self) {
self = [super init];
_dictionary = [NSMutableDictionary dictionary];
}

return self;
}

- (void)storeValue:(NSInteger)value forKey:(NSString *)key {
[self.dictionary setValue:@(value) forKey:key];
}

@end

int main(int argc, const char * argv[]) {

Holder *holder = [Holder new];

for (NSInteger i = 0; i < 5000; i++) {
[holder storeValue:i forKey:[NSString stringWithFormat:@"%ld", i]];
}

}

Obj-C 正在快速推出。

time ./loop 

real 0m0.013s
user 0m0.006s
sys 0m0.003s

与您给出的 NoHolder 示例在时间上的相似性很好地表明了 Obj-C 编译器正在进行多少优化。

查看 Swift 中 -O3-Ofast 级别的程序集,可以看出完成的安全检查量存在很大差异。查看 Obj-C 程序集表明,好吧,要执行的内容要少得多。因为让程序变快的关键是让它不需要做太多……

OS-X-Dos-Equis:~ joshwisenbaker$ wc -l objc.txt 
159 objc.txt
OS-X-Dos-Equis:~ joshwisenbaker$ wc -l oFast.txt
3749 oFast.txt

(编辑:更新完成 Holder 类的结果。)

所以另一个有趣的问题是在类定义上使用了 @final 装饰。如果您知道您的类永远不会被子类化,那么请尝试添加这样的关键字:@final class Holder

如您所见,当以相同方式编译时,它还规范化了性能。

OS-X-Dos-Equis:~ joshwisenbaker$ swift -sdk $(xcrun --show-sdk-path --sdk macosx) -Ofast bench.swift && time ./bench

real 0m0.013s
user 0m0.007s
sys 0m0.003s

即使只使用 -O3 @final 也能发挥神奇的作用。

OS-X-Dos-Equis:~ joshwisenbaker$ swift -sdk $(xcrun --show-sdk-path --sdk macosx) -O3  bench.swift && time ./bench

real 0m0.015s
user 0m0.009s
sys 0m0.003s

同样,我认为您看到的性能差异可能归因于编译时的当前优化级别。

关于performance - 即使使用 -Ofast,Swift 的字典也很慢,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24476943/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com