作者热门文章
- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我们正在从 latin1 转移到 UTF-8,并且有 10 万行 python 代码。
另外我是 python 新手(哈哈哈!)。
我已经知道 str()
函数在接收 Unicode 时会失败,所以我们应该使用 unicode()
而不是它,效果几乎相同。
代码还有哪些“危险”的地方?
是否有迁移到 UTF-8 的任何基本准则/算法?它可以写成一个自动的“代码转换器”吗?
最佳答案
str
和 unicode
是类,不是函数。当您调用 str(u'abcd')
时,您正在初始化一个以 'abcd' 作为变量的新字符串。 str()
可用于将任何类型的字符串转换为 ascii str
。
其他需要注意的地方是从文件/输入中读取时,或者基本上是从不是为 unicode 编写的函数返回的字符串形式的任何内容。
享受 :)
关于python - 如何将 python 2.6 项目移动到 UTF-8?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5350958/
我是一名优秀的程序员,十分优秀!