gpt4 book ai didi

python - Python 中用于卡纳达语的 Unicode

转载 作者:太空宇宙 更新时间:2023-11-04 09:06:09 25 4
gpt4 key购买 nike

我正在尝试使用 Unicode 来处理 Kannada 语言,当我输入以下代码时,我正在使用 Python 2.7:

print u'\u0cb5\u0ccd\u0c87'

输出是ವ್ಇ,但我希望用卡纳达语打印“vi”??

最佳答案

我相信您没有正确编码您的字符串。我希望这就是您想要的:

>>> print u'\u0cb5\u0CBF'
ವಿ

您所做的是输出(使用 Unicode 分配给这些字符的全名):

  • 卡纳达语字母 VA
  • KANNADA 标志 VIRAMA
  • 卡纳达语字母 I

我可以看出其中的逻辑,但这不是 Unicode 的工作方式。 virama 应该只用于辅音簇,或者如果你有一个以辅音结尾的序列。要将音节与元音组合,您必须将音节与元音的组合形式一起使用:

  • 卡纳达语字母 VA
  • 卡纳达语元音符号 I

KANNADA VOWEL SIGN I 是字母“I”的组合形式,而 KANNADA LETTER I 是同一字母的非组合形式。

我建议阅读 chapter 9 of the Unicode standard有关如何处理南亚文字的完整说明。 Chapter 10也很有用。

关于python - Python 中用于卡纳达语的 Unicode,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20701879/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com