gpt4 book ai didi

unicode - Unicode 标准中正确的表情符号列表是什么?

转载 作者:行者123 更新时间:2023-12-02 04:00:45 25 4
gpt4 key购买 nike

我正在尝试查找 Unicode 标准定义的表情符号代码点的官方列表,但遇到了一些相互冲突的来源:根据 emoji-data.txt偶数位是表情符号; unicode.org 上的其他来源建议仅该列表的一个子集是表情符号,例如 the emoji chartemoji test file 。 Unicode 技术报告 #51 中甚至有一个名为 Which Characters are Emoji 的部分。但它并没有真正回答我的问题,或者至少我在那里看不到它。

那么,哪些 Unicode 代码点是表情符号?

最佳答案

并非所有表情符号字形都是从单个 Unicode 代码点创建的。有些字符只有在组合成“表情符号序列”时才会出现表情符号外观。这使得仅通过代码点来计算表情符号字符变得很困难。这就是Section 3 in UTR #51正在尝试传达,但可以通过一些示例进行改进:

  • U+0031 为 1,但与 U+FE0F U+20E3 组合时呈现表情符号外观:1️⃣(或与 U 组合的普通外观+FE0E U+20E3:1︎⃣)。
  • U+1F170 是 🅰,但与 U+FE0F 组合时呈现表情符号外观:🅰️。
  • U+2620 是 ☠︎,但与 U+FE0F 组合时呈现表情符号外观:☠️。
  • (一般来说,U+FE0F variation sequence 用于将许多现有字符转换为相应的表情符号序列,而无需将它们编码为单独的代码点。)
  • 区域指示符号仅在构成国家/地区代码时显示为表情符号:U+1F1E6 U+1F1F6 🇦🇶,但不显示 U+1F1E6 U+1F1F5 > 🇦🇵。

emoji-data.txt 文件列出了具有 Emoji=Yes 字符属性的所有字符。这些都是基本字符(例如 1、🅰、☠︎、🇦、🇶、🇵),即使它们本身不是完整的序列,但至少可以启动表情符号序列。 emoji-test.txt 文件列出了所有完整的表情符号序列。

关于unicode - Unicode 标准中正确的表情符号列表是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42026124/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com