- ubuntu12.04环境下使用kvm ioctl接口实现最简单的虚拟机
- Ubuntu 通过无线网络安装Ubuntu Server启动系统后连接无线网络的方法
- 在Ubuntu上搭建网桥的方法
- ubuntu 虚拟机上网方式及相关配置详解
CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.
这篇CFSDN的博客文章Python3如何解决字符编码问题详解由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.
编码 。
因为计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理。最早的计算机在设计时采用8个比特(bit)作为一个字节(byte),所以,一个字节能表示的最大的整数就是255(二进制11111111=十进制255),如果要表示更大的整数,就必须用更多的字节。比如两个字节可以表示的最大整数是65535,4个字节可以表示的最大整数是4294967295.
由于计算机是美国人发明的,因此,最早只有127个字母被编码到计算机里,也就是大小写英文字母、数字和一些符号,这个编码表被称为ASCII编码,比如大写字母A的编码是65,小写字母z的编码是122.
Python3字符编码 。
Python3 最重要的一项改进之一就是解决了 Python2 中字符串与字符编码遗留下来的这个大坑.
Python2 字符串设计上的一些缺陷:
当然这并不算 Bug,只要处理的时候多留心也可以避免这些坑。但在 Python3 两个问题都很好的解决了.
首先,Python3 把系统默认编码设置为 UTF-8 。
1
2
3
4
|
>>>
import
sys
>>> sys.getdefaultencoding()
'utf-8'
>>>
|
然后,文本字符和二进制数据区分得更清晰,分别用 str 和 bytes 表示。文本字符全部用 str 类型表示,str 能表示 Unicode 字符集中所有字符,而二进制字节数据用一种全新的数据类型,用 bytes 来表示.
str 。
1
2
3
4
5
6
7
8
9
10
11
|
>>> a
=
"a"
>>> a
'a'
>>>
type
(a)
<
class
'str'
>
>>> b
=
"禅"
>>> b
'禅'
>>>
type
(b)
<
class
'str'
>
|
bytes 。
Python3 中,在字符引号前加‘b',明确表示这是一个 bytes 类型的对象,实际上它就是一组二进制字节序列组成的数据,bytes 类型可以是 ASCII范围内的字符和其它十六进制形式的字符数据,但不能用中文等非ASCII字符表示.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
|
>>> c
=
b
'a'
>>> c
b
'a'
>>>
type
(c)
<
class
'bytes'
>
>>> d
=
b
'\xe7\xa6\x85'
>>> d
b
'\xe7\xa6\x85'
>>>
type
(d)
<
class
'bytes'
>
>>>
>>> e
=
b
'禅'
File
"<stdin>"
, line
1
SyntaxError: bytes can only contain ASCII literal characters.
|
bytes 类型提供的操作和 str 一样,支持分片、索引、基本数值运算等操作。但是 str 与 bytes 类型的数据不能执行 + 操作,尽管在py2中是可行的.
1
2
3
4
5
6
7
8
9
10
11
12
13
|
>>> b
"a"
+
b
"c"
b
'ac'
>>> b
"a"
*
2
b
'aa'
>>> b
"abcdef\xd6"
[
1
:]
b
'bcdef\xd6'
>>> b
"abcdef\xd6"
[
-
1
]
214
>>> b
"a"
+
"b"
Traceback (most recent call last):
File
"<stdin>"
, line
1
,
in
<module>
TypeError: can't concat bytes to
str
|
python2 与 python3 字节与字符的对应关系 。
python2 | python3 | 表现 | 转换 | 作用 |
str | bytes | 字节 | encode | 存储 |
unicode | str | 字符 | decode | 显示 |
encode 与 decode 。
str 与 bytes 之间的转换可以用 encode 和从decode 方法.
encode 负责字符到字节的编码转换。默认使用 UTF-8 编码准换.
1
2
3
4
5
|
>>> s
=
"Python之禅"
>>> s.encode()
b
'Python\xe4\xb9\x8b\xe7\xa6\x85'
>>> s.encode(
"gbk"
)
b
'Python\xd6\xae\xec\xf8'
|
decode 负责字节到字符的解码转换,通用使用 UTF-8 编码格式进行转换.
1
2
3
4
|
>>> b
'Python\xe4\xb9\x8b\xe7\xa6\x85'
.decode()
'Python之禅'
>>> b
'Python\xd6\xae\xec\xf8'
.decode(
"gbk"
)
'Python之禅'
|
总结 。
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流.
原文链接:https://foofish.net/how-python3-handle-charset-encoding.html 。
最后此篇关于Python3如何解决字符编码问题详解的文章就讲到这里了,如果你想了解更多关于Python3如何解决字符编码问题详解的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。
@Cacheable在同一类中方法调用无效 上述图片中,同一个类中genLiveBullets()方法调用同类中的queryLiveByRoom()方法,这样即便标识了Cacheable标签,
目录 @Transaction注解导致动态切换更改数据库失效 使用场景 遇到问题 解决 @Transaction
@RequestBody不能class类型匹配 在首次第一次尝试使用@RequestBody注解 开始加载字符串使用post提交(貌似只能post),加Json数据格式传输的时候,
目录 @Autowired注入static接口问题 @Autowired自动注入普通service很方便 但是如果注入static修饰的serv
目录 @RequestBody部分属性丢失 问题描述 JavaBean实现 Controller实现
目录 解决@PathVariable参数接收不完整的问题 今天遇到的问题是: 解决办法: @PathVariable接受的参
这几天在项目里面发现我使用@Transactional注解事务之后,抛了异常居然不回滚。后来终于找到了原因。 如果你也出现了这种情况,可以从下面开始排查。 1、特性 先来了解一下@Trans
概述: ? 1
场景: 在处理定时任务时,由于这几个方法都是静态方法,在aop的切面中使用@Around注解,进行监控方法调用是否有异常。 发现aop没有生效。 代码如下:
最近做项目的时候 用户提出要上传大图片 一张图片有可能十几兆 本来用的第三方的上传控件 有限制图片上传大小的设置 以前设置的是2M&nb
我已经实现了这个SCIM reference code在我们的应用程序中。 我实现的代码确实通过了此postman link中存在的所有用户测试集合。 。我的 SCIM Api 也被 Azure 接受
我一直对“然后”不被等待的行为感到困扰,我明白其原因。然而,我仍然需要绕过它。这是我的用例。 doWork(family) { return doWork1(family)
我正在尝试查找 channel 中的消息是否仍然存在,但是,我不确定如何解决 promise ,查看其他答案和文档,我可以看到它可能是通过函数实现的,但我是不完全确定如何去做。我希望能在这方面获得一些
我有以下情况: 同一工作区中的 2 个 Eclipse 项目:Apa 和 Bepa(为简洁起见,使用化名)。 Apa 项目引用(包括)Bepa 项目。 我在 Bepa 有一个类 X,具有公共(publ
这个问题已经有答案了: Why am I getting a NoClassDefFoundError in Java? (31 个回答) 已关闭 6 年前。 我正在努力学习 spring。所以我输入
我正在写一个小游戏,屏幕上有许多圆圈在移动。 我在两个线程中管理圈子,如下所示: public void run() { int stepCount = 0; int dx;
我在使用 Sympy 求解方程时遇到问题。当我运行代码时,例如: 打印(校正(10)) 我希望它打印一个数字 f。相反,它给我错误:执行中止。 def correction(r): from
好吧,我制作的每个页面都有这个问题。我不确定我做错了什么,但我所有的页面都不适用于所有分辨率。可能是因为我使用的是宽屏?大声笑我不确定,但在小于宽屏分辨率的情况下,它永远不会看起来正确。它的某些部分你
我正在尝试像这样进行一个非常简单的文化 srting 检查 if(culture.ToUpper() == "ES-ES" || "IT-IT") { //do something } else
Closed. This question is off-topic. It is not currently accepting answers. Learn more。 想改进这个问题吗?Upda
我是一名优秀的程序员,十分优秀!