gpt4 book ai didi

php - 什么取决于何时在特定的 "composition"中考虑字符?

转载 作者:搜寻专家 更新时间:2023-10-31 21:16:45 24 4
gpt4 key购买 nike

在 Unicode 中,一个字符可以被认为是不同的“组合”。

例如字符à,其codepoint是U+00E0,它也是由两个code point组成:U+0061加上重音 U+0300

剩下的问题是:

角色最终被纳入特定构图取决于什么?我的意思是:键盘?编码?复制粘贴文本?

我知道如何识别 \X 元字符,但我希望有人能解释我的疑惑。

最佳答案

尽管有规范化形式(特别是 NFC)形式的约定,但最终取决于操作系统在您按下键时存储哪些代码点:

http://en.wikipedia.org/wiki/Unicode_equivalence#Normalization

复制和粘贴复制代码点,而不是字素的概念(字素是一个不太含糊的术语,因为字符可以表示字素和代码点)。

如果您要从其他一些字符集转换为 Unicode,那么转换映射将决定您最终得到的代码点,并且它几乎总是匹配源字符集编码复合字符的方式 - 其中源字符集有一个LATIN A WITH UMLAUT 的单个代码点,那么 Unicode 也将如此。

关于php - 什么取决于何时在特定的 "composition"中考虑字符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6880634/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com