ruby - Ruby 中的 Æ、Ø 和 Å - 为什么 ("A"。 ."Å").to

ruby - Ruby 中的 Æ、Ø 和 Å - 为什么 ("A"。 ."Å").to_a 返回双字母表？

转载作者：数据小太阳更新时间：2023-10-29 08:25:56

我在 IRB 中玩耍，发现:

("A".."Z").to_a(当然)返回:

=> ["A", "B", "C", "D", "E", "F", "G", "H", "I", "J", "K", "L", "M", "N", "O", "P", "Q", "R", "S", "T", "U", "V", "W", "X", "Y", "Z"]

但是 ("A".."Å").to_a 返回:

=> ["A", "B", "C", "D", "E", "F", "G", "H", "I", "J", "K", "L", "M", "N", "O", 
"P", "Q", "R", "S", "T", "U", "V", "W", "X", "Y", "Z", "AA", "AB", "AC", "AD", 
"AE", "AF", "AG", "AH", "AI", "AJ", "AK", "AL", "AM", "AN", "AO", "AP", "AQ", 
"AR", "AS", "AT", "AU", "AV", "AW", "AX", "AY", "AZ", "BA", "BB", "BC", "BD", 
"BE", "BF", "BG", "BH", "BI", "BJ", "BK", "BL", "BM", "BN", "BO", "BP", "BQ", 
"BR", "BS", "BT", "BU", "BV", "BW", "BX", "BY", "BZ", "CA", "CB", "CC", "CD", 
...
"ZR", "ZS", "ZT", "ZU", "ZV", "ZW", "ZX", "ZY", "ZZ"]

我尝试阅读有关 to_a 方法的内容，但找不到任何解释此行为的内容。

为什么会这样？

最佳答案

("A".."Å") 的工作方式类似于 "A".upto("Å")。现在关于 String#upto 有两件事:

它使用 String#succ 获取下一个值。
根据 the Ruby specs如果当前字符串的大小大于最终字符串的大小，它将停止迭代。这样做可能是为了避免无限范围。

“Å”被编码为两个字节:

"Å".bytes # => [195, 133]

虽然 “A” 仅编码为一个:

"A".bytes # => [65]

让我们开始迭代:

"A".succ # => "B"
"B".succ # => "C"
# ...
"Y".succ # => "Z"
"Z".succ # => "AA"

"AA".succ # => "AB"
# ...
"ZY".succ # => "ZZ"
"ZZ".succ # => "AAA"

现在 “AAA” 仍然比 “Å”“小”:

"AAA" < "Å" # => true

但是它有 3 个字节的大小:

"AAA".bytes # => [65, 65, 65]

因此根据 the spec , 范围到此为止。

关于ruby - Ruby 中的 Æ、Ø 和 Å - 为什么 ("A"。 ."Å").to_a 返回双字母表？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/50133624/

文章推荐： ruby - 用 Ruby 计算日期

文章推荐： ruby - 这个语法叫什么？ { |n| "user#{n}"}

文章推荐： ruby - rspec 中定义的匿名类不会响应新的

数据小太阳

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

ruby - Ruby 中的 Æ、Ø 和 Å - 为什么 ("A"。 ."Å").to_a 返回双字母表？