gpt4 book ai didi

西里尔文 'С' 和拉丁文 'C' 的 Unicode 比较

转载 作者:行者123 更新时间:2023-12-02 12:28:59 31 4
gpt4 key购买 nike

我有一个混合使用 unicode 字符\u0421、'С' 和\u0043、'C' 的数据集。是否有某种 unicode 比较认为这两个字符相同?到目前为止,我已经尝试了几种 ICU 校对,包括俄语校对。

最佳答案

没有 Unicode 比较可以根据字形的视觉标识将字符视为相同的字符。然而,Unicode 技术标准#39,Unicode Security Mechanisms ,处理“易混淆的字符”——由于视觉同一性或相似性而可能相互混淆的字符。它包括一个数据文件confusables以及“intentionally confusable”对,即“在使用统一字体设计时,任何特定字体中的字形可能被设计为形状相同的字符”,主要由成对的拉丁字母和西里尔字母或希腊字母组成,例如 C 和 С。您可能需要编写自己对这些数据的使用的代码,因为 ICU 似乎没有任何与容易混淆的概念相关的内容。

关于西里尔文 'С' 和拉丁文 'C' 的 Unicode 比较,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19351711/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com