gpt4 book ai didi

ruby - 如何将 UTF8 组合字符转换为 ruby​​ 中的单个 UTF8 字符?

转载 作者:数据小太阳 更新时间:2023-10-29 06:36:55 25 4
gpt4 key购买 nike

一些字符,例如 Unicode 字符 'LATIN SMALL LETTER C WITH CARON' 可以编码为 0xC4 0x8D,但也可以用 'LATIN SMALL LETTER C' 和'COMBINING CARON',即 0x63 0xcc 0x8c
更多信息在这里:http://www.fileformat.info/info/unicode/char/10d/index.htm

我想知道是否有一个库可以将“LATIN SMALL LETTER C”+“COMBINING CARON”转换为“LATIN SMALL LETTER C WITH CARON”。或者是否有包含这些转化的表格?

最佳答案

这些转化并不总是存在。例如,U+0063 (c) 和 U+030C 的组合(组合卡隆)可以表示为单个字符,但是没有预组合字符表示带有卡隆 (w̌) 的小写字母“w”。

不过,存在可以在可能的情况下执行此组合的库。查找名为“NFC”(规范化形式:组合)的 Unicode 函数。参见,例如:http://unicode-utils.rubyforge.org/classes/UnicodeUtils.html#M000015

关于ruby - 如何将 UTF8 组合字符转换为 ruby​​ 中的单个 UTF8 字符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6936390/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com