gpt4 book ai didi

unicode - 在 Unicode 中查找相似的 ASCII 字符

转载 作者:行者123 更新时间:2023-12-01 16:26:05 29 4
gpt4 key购买 nike

有人知道在 Unicode 中查找与 ASCII 字符相似的字符的简单方法吗?一个例子是“CYRILLIC SMALL LETTER DZE (ѕ)”。我想搜索并替换相似的字符。我所说的“相似”是指人类可读的。光看它是看不出有什么区别的。

最佳答案

正如其他评论者所指出的,Unicode normalisation (“兼容性字符”)不会在这里帮助您,因为您不是在寻找官方等效项,而是在寻找字形(字母形状)的相似之处。 (不过,链接的 Unicode 技术报告仍然值得一读,因为它写得非常好。)

如果我是您,为了免去您自己组装字符列表的繁琐工作,我会在 homograph attacks 上搜索资源:这是一种恶意误导网络用户的方法,通过显示包含域名的 URL,其中某些字母已被替换为视觉上相似的字母。另Unicode Technical Report关于安全性,包含有关该问题的部分。还有——这可能是您最需要的——"confusables" table 。这是另一篇主要包含标点符号的文章,其中一些是 ASCII,在 non-ASCII code tables 中具有视觉上相似的对应项。 .

我真正希望的是您提出的问题不是为了构造这样的攻击。<​​/p>

关于unicode - 在 Unicode 中查找相似的 ASCII 字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3403877/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com