gpt4 book ai didi

unicode - Unicode 中视觉相同的字符

转载 作者:行者123 更新时间:2023-12-04 15:01:31 34 4
gpt4 key购买 nike

我想为 Unicode 中的特定字符找到视觉上相同的字符。
我知道如何找到一个字符的规范或兼容性分解;但他们没有给我我想要的。
我想找到视觉上相同(不相似)的字符,它们唯一的区别可能是它们的大小。

例如我想要:(s,S) 或 (S,S)(其代码点不同)。
我不想要 (ß, β) 或 (e, é)。

有什么建议?谢谢。

最佳答案

对于特定字符,您可以从 Unicode 标准中的代码图表中的注释开始。注释通常出于各种原因引用其他字符,包括形状的相似性或同一性。但是注释并不意味着涵盖所有内容。

您也可以在 http://shapecatcher.com/ 绘制您的角色并要求它识别它。你经常会得到一长串视觉上相似的替代品。

正如@TedHopp 在他的评论中所写的那样,视觉识别取决于字体。例如,“s”和“S”的形状不必相同;在大多数字体中,它们不是——基本形式是相同的,但在笔画宽度变化、曲率、衬线等方面存在各种差异。但是,可以预期某些字符在包含它们的任何字体中在视觉上是相同的,例如如拉丁大写字母 A、希腊大写字母 alpha 和西里尔字母大写字母 А。

您没有具体说明研究的目的,但您可能正在做一些 Unicode 联盟在某种程度上已经开展的工作。见 UTR #6 , Unicode 安全注意事项,其中还包含对相关工作的引用,包括 UTS #9 , Unicode Security Mechanisms,其中包含 confusables.txt,推荐用于 IDN 的可混淆映射(即,对于特定上下文,但也可能对其他目的有用)。

关于unicode - Unicode 中视觉相同的字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13260890/

34 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com