gpt4 book ai didi

unicode - 如何从 Unicode 网站获取完整的 Unicode 表情符号列表

转载 作者:行者123 更新时间:2023-12-05 05:45:21 28 4
gpt4 key购买 nike

我正在构建一个需要使用表情符号的应用程序,特别是生成大量随机表情符号序列。这需要有一个大列表可供选择。而不是采取方法 detailed here通过循环硬编码十六进制范围,我决定采用不同的方法并从 the Unicode website 下载和解析数据。 .从那里,我进行了一些代码生成并将所有独特的表情符号写入磁盘,然后我可以在我的应用程序中获取它们。所有这些都是作为我的应用程序的手动步骤或构建步骤发生的。

但是,Unicode 规范复杂,我不确定应该从哪些数据中提取数据来构建最终列表。最新版本的Unicode(14.0)下有三个文件:

Unicode 字符数据库 (UCD) 中还有两个文件:

所有这些列表中肯定有重复项,例如 😀 虽然我可以下载并解析所有五个文件并将列表缩减为我脚本中的唯一实例,但我希望我的脚本尽可能简单做不必要的工作。

据我了解:

  • emoji-test.txt 是一组表情符号字符,就像您在键盘上看到的那样,按类别分组
  • emoji-sequences.txt 是表情符号范围、单个表情符号和多字符表情符号的列表,例如 🇦🇨 (1F1E6 1F1E8) 或与变体选择器结合的表情符号,例如 FE0F
  • emoji-zwj-sequences.txt 是由零宽度连接字符连接的表情符号列表
  • emoji-variation-sequences 是一个表情符号列表,可以以文本形式或表情符号呈现
  • emoji-data.txt 似乎是一个非常全面的列表,不仅包含表情符号,还包含表情符号修饰符等

所有这些让我很困惑,不知道哪个列表或列表组合会给我最全面的表情符号列表。 emoji-data.txt 似乎有一个范围最广的列表,但我不想要表情符号修饰符或表情符号组件之类的东西;我只是在寻找用户可以使用键盘选择的表情符号(例如,您不能自己选择肤色修饰符)。

哪些列表或列表组合会产生我可以在我的应用中使用的最全面、范围最广的表情符号列表?

最佳答案

使用 emoji-sequences.txt 和 emoji-zwj-sequences.txt 的联合。该集合包含推荐用于一般交流的表情符号。见https://www.unicode.org/reports/tr51/tr51-19.html#def_rgi_set .

关于unicode - 如何从 Unicode 网站获取完整的 Unicode 表情符号列表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/71404081/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com