gpt4 book ai didi

Swift 字符串和整数下标

转载 作者:可可西里 更新时间:2023-11-01 00:35:09 25 4
gpt4 key购买 nike

这是一个理论问题

为什么以下(以及更多类比)不是 Swift 标准库的一部分?什么是坏情况

extension String {
subscript(_ range: Range<Int>) -> Substring {
return self[index(startIndex, offsetBy: range.lowerBound)..<index(startIndex, offsetBy: range.upperBound)]
}
}

extension Substring {
subscript(_ range: Range<Int>) -> Substring {
return self[index(startIndex, offsetBy: range.lowerBound)..<index(startIndex, offsetBy: range.upperBound)]
}
}

最佳答案

为了扩展 Hamish 的观点,这会产生非常令人惊讶的行为。让我们考虑更简单(但等效)的 string[int] 情况,这将以此为基础。为什么不用整数下标字符串。

字符串是字符的集合,而不是字节。它们可以用 UTF-8 存储,这意味着你不知道一个字符有多大,也不能随便跳到任意地方。为了弄清楚“字符 100”,您必须从头开始解码所有内容。那是 O(n)。

所以你这样写代码,感觉很“安全”:

for index in 0..<string.count {
print(string[index])
}

但 secret 地这是 O(n^2) 这真的很令人惊讶,因为它确实看起来像 O(n)。你可能会说“好吧,我的字符串只有 20 个字符长,所以谁在乎呢”,但我们将字符串用于很多事情,包括数兆字节的 NSTextStorage。 (与其他一些语言相比,这在 Swift 中得到了显着扩展,因为 Swift 包含通用算法,其性能 promise 依赖于下标为 O(1) 这一事实。)

所以我可以让您的事情变得“简单”,直到您突然关心性能时,事情变得非常困难。 (而且我指的“性能”并不是“超快”。我的意思是“性能”是指“不会让整个应用程序停止几分钟。”)

具有“简单”索引的语言之所以“简单”,是因为它们忽略了 Unicode。所以一切都很好,直到你被喂了一个表情符号,它就会爆炸,你必须编写疯狂的讨厌代码来解决它。 Swift 决定将表情符号(以及中文、阿拉伯语、泰语等)之类的东西放入字符串中是非常正常的东西,因此应该作为一流的东西处理,而不是在事情爆炸时解决。

如果你想学习一门反其道而行之的语言,看看 Go,它有一个字符串的“ rune ”系统,在表情符号出现的那一刻很难正确。 Go 的回答是“当可能存在多字节字符时,程序员应该做正确的事情”。 Swift 的回答是“语言应该总是做正确的事”。两者都有合理的论点,但 Swift 的方法避免了许多现实世界的错误(比如我在使用 ObjC 时不小心截断多字节密码时为我的中国用户引入的可怕的安全问题)。

关于Swift 字符串和整数下标,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46162830/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com