gpt4 book ai didi

unicode - 表情符号的正确 NFD 形式和比较

转载 作者:行者123 更新时间:2023-12-02 03:11:50 24 4
gpt4 key购买 nike

鉴于现在有一些代码点的文本与表情符号显示的选择器,这些代码点的正确分解形式是什么?例如,❤︎ (U+2764) 默认为文本表示,但如果后跟 VS-16 (U+fe0f) 可以变成表情符号:❤️。您可以使用 VS-15 (U+fe0e) 强制文本表示。这是否意味着 U+2764 的 NFD 应该变成 U+2764 U+fe0e? U+2764 U+fe0e 和 U+2764 是否应该被视为相同(就像 é (U+00e9) 与 é (U+0065 U+0301) 相同)?文本 vs 表情符号表示呢?他们也应该受到同样的对待吗?

最佳答案

没有 decomposition mappingUnicode database用于表情符号和变体选择器。标准even states :

The initial character in a variation sequence is never [...] a canonical decomposable character.

这意味着带有或不带有变体选择器的表情符号在 NFD 下不会改变。

此外,据我所知,Unicode 没有指定没有变体选择器的代码点的默认表示。这取决于实现。

关于unicode - 表情符号的正确 NFD 形式和比较,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39596157/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com