gpt4 book ai didi

unicode - 查找在Unicode字形上相似的字符?

转载 作者:行者123 更新时间:2023-12-03 13:26:13 29 4
gpt4 key购买 nike

可以说我的字符是Ú,characters,Ü。它们在字形上都类似于英语U。

是否有一些列表或算法可以做到这一点:


给定Ú或Ù或Ü返回英语U
给定一个英语U,返回所有与U相似的字符的列表


我不确定所有字体中Unicode字符的代码点是否相同?
如果是这样,我想可以有一些简单有效的方法来做到这一点?

更新

如果您使用的是Ruby,则有可用的gem可以在某些情况下提供帮助。

最佳答案

这并非在所有条件下都适用,但是摆脱大多数重音符号的一种方法是将字符转换为可分解的形式,然后丢弃组合的重音符号:

# coding: utf8
import unicodedata as ud
s=u'U, Ù, Ú, Û, Ü, Ũ, Ū, Ŭ, Ů, Ű, Ų, Ư, Ǔ, Ǖ, Ǘ, Ǚ, Ǜ, Ụ, Ủ, Ứ, Ừ, Ử, Ữ, Ự'
print ud.normalize('NFD',s).encode('ascii','ignore')


输出量

U, U, U, U, U, U, U, U, U, U, U, U, U, U, U, U, U, U, U, U, U, U, U, U


要查找重音字符,请使用类似以下内容的字符:

import unicodedata as ud
import string

def asc(unichr):
return ud.normalize('NFD',unichr).encode('ascii','ignore')

U = u''.join(unichr(i) for i in xrange(65536))
for c in string.letters:
print u''.join(u for u in U if asc(u) == c)


输出量

aàáâãäåāăąǎǟǡǻȁȃȧḁạảấầẩẫậắằẳẵặ
bḃḅḇ
cçćĉċčḉ
dďḋḍḏḑḓ
eèéêëēĕėęěȅȇȩḕḗḙḛḝẹẻẽếềểễệ
fḟ
:
etc.

关于unicode - 查找在Unicode字形上相似的字符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4846365/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com