作者热门文章
- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我在使用 python 逐个字符地遍历 unicode 字符串时遇到问题。
print "w: ",word
for c in word:
print "word: ",c
这是我的输出
w: 文本
word: ?
word: ?
word: ?
word: ?
word: ?
word: ?
我想要的输出是:
文
本
当我使用 len(word) 时,我得到 6。显然每个字符都是 3 个 unicode block 。
因此,我的 unicode 字符串已成功存储在变量中,但我无法取出字符。我尝试过使用 encode('utf-8')、decode('utf-8) 和编解码器,但仍然无法获得任何好的结果。这似乎是一个简单的问题,但对我来说却非常困难。
希望有人能指出我正确的方向。
谢谢!
最佳答案
# -*- coding: utf-8 -*-
word = "文本"
print(word)
for each in unicode(word,"utf-8"):
print(each)
输出:
文本
文
本
关于python - 在 Python 中遍历一个 unicode 字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30971609/
我是一名优秀的程序员,十分优秀!