>> length "Níðhöggr" 9 最佳答案 “Níðhöggr”包含9个Unicode字符: U+004E N (Lu): L-6ren">
gpt4 book ai didi

haskell - 为什么 "Níðhöggr"的长度是9?

转载 作者:行者123 更新时间:2023-12-02 09:28:55 24 4
gpt4 key购买 nike

为什么length函数说这个8个字符的字符串是9个字符?

>>> length "Níðhöggr"
9

最佳答案

“Níðhöggr”包含9个Unicode字符:

U+004E N (Lu): LATIN CAPITAL LETTER N 
U+00ED í (Ll): LATIN SMALL LETTER I WITH ACUTE
U+00F0 ð (Ll): LATIN SMALL LETTER ETH
U+0068 h (Ll): LATIN SMALL LETTER H
U+006F o (Ll): LATIN SMALL LETTER O
U+0308 ̈ (Mn): COMBINING DIAERESIS
U+0067 g (Ll): LATIN SMALL LETTER G
U+0067 g (Ll): LATIN SMALL LETTER G
U+0072 r (Ll): LATIN SMALL LETTER R

您可能想要使用“Níðhöggr”,它在打印时看起来相同,但包含 U+00F6 LATIN SMALL LETTER O with DIAERESIS 而不是两个字符 ö 组合。换句话说,它采用组合范式 (NFC)。

或者您可能需要“Níðhöggr”,它有 10 个 Unicode 字符(í 被分割成 i 和组合重音)。这将是分解范式(NFD)。

Google“Unicode 规范化”以获取有趣和/或毛茸茸的细节。使用this function在 Haskell 中标准化 Unicode 数据(感谢 Adam Rosenfield!)。

关于haskell - 为什么 "Níðhöggr"的长度是9?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16779251/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com