gpt4 book ai didi

Python中文字符串截取问题

转载 作者:qq735679552 更新时间:2022-09-29 22:32:09 24 4
gpt4 key购买 nike

CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章Python中文字符串截取问题由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.

先来看个例子:

?
1
2
3
4
#-*- coding:utf8 -*-
s = u '中文截取'
s.decode( 'utf8' )[ 0 : 3 ].encode( 'utf8' )
# 结果u'中文截取

延伸阅读:

UTF-8中的汉字占用多少字节? 占2个字节的:〇 占3个字节的:基本等同于GBK,含21000多个汉字 占4个字节的:中日韩超大字符集里面的汉字,有5万多个 一个UTF-8数字占1个字节 一个UTF-8英文字母占1个字节 。

在查找 UTF-8 编码资料时发现,很多的帖子说的 UTF-8 编码里,一个汉字占用3个字节,有的还做了个证明,大概是这样的,创建一个没有BOM的UTF-8编码的文本文件,里面保存了几个汉字,然后查看文件的大小。我觉得这样的证明没有一点说服力,因为 UTF-8 是变长的,1-6个字节,少量的汉字检测是不能说明所有的汉字都是的.

后来我又查看了字符映射表-汉语,找到了正确的答案,少数是汉字每个占用3个字节,多数占用4个字节.

以上所述就是本文的全部内容了,希望大家能够喜欢.

最后此篇关于Python中文字符串截取问题的文章就讲到这里了,如果你想了解更多关于Python中文字符串截取问题的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com