gpt4 book ai didi

unicode - Perl 6 将如何处理新的组合表情符号长度?

转载 作者:行者123 更新时间:2023-12-03 03:29:01 30 4
gpt4 key购买 nike

一些表情符号现在可以组合。例如,U+1f441 (👁) U+200d (ZWJ) U+1f5e8 (🗨) 组合起来形成 👁‍🗨 ( I am a witness )。 MoarVM 2016.07 上的 Rakudo 2016.07.1 表示有两个字素:

> "\x[1f441]\x[200d]\x[1f5e8]".chars
2

我认为应该是1。似乎也有类似的问题

> "\x[1f441]\x[fe0f]\x[200d]\x[1f5e8]\x[fe0f]".chars
2

但至少它可以正确处理 U+fe0f(VS-16,表情符号表示)。

是否有计划在 Perl 6 的更高版本中修复此问题,或者我是否误解了 chars 方法的意图?

最佳答案

你提到的ZWJ序列只是Unicode Emoji 4.0的一部分目前仍处于草案状态,计划于 November 2016 发布。在此新版本下,U+1F5E8 具有 Grapheme_Cluster_Break 属性 E_Base_GAZ (EBG) ,因此该序列确实应该形成单个字素簇。

我确信 Perl 6 会在某个时候迎头 catch 。

关于unicode - Perl 6 将如何处理新的组合表情符号长度?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39595880/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com