gpt4 book ai didi

python - 使用不同的字母表检测相同的单词?

转载 作者:太空宇宙 更新时间:2023-11-03 14:09:23 26 4
gpt4 key购买 nike

Python 对待单词 МАМАMAMA 的方式不同,因为其中一个是用拉丁文写的,另一个是用西里尔文写的。

如何让python把它们当作一个相同的字符串?

我只关心异形。

最佳答案

有一个名为 transliterate 的 python 库可以进行西里尔文到拉丁文 unicode 的翻译。

>>> from transliterate import translit
>>>
>>> cy = u'\u041c\u0410\u041c\u0410'
>>> en = u'MAMA'
>>> cy == en
False
>>> cy_converted = translit(cy, 'ru', reversed=True)
>>> cy_converted == en
True
>>> cy_converted
u'MAMA'

关于python - 使用不同的字母表检测相同的单词?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40208006/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com