Python2中文处理纪要的实现方法-6ren

Python2中文处理纪要的实现方法

转载作者：qq735679552 更新时间：2022-09-28 22:32:09

CFSDN坚持开源创造价值，我们致力于搭建一个资源共享平台，让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章Python2中文处理纪要的实现方法由作者收集整理，如果你对这篇文章有兴趣，记得点赞哟.

python2不是以unicode作为基本代码字符类型，碰到乱码的几率是远远高于python3，但即便如此，相信很多人，也不想随意的迁移到python3，这里就总结几个我平常碰到的问题及解法.

1、文件中无法使用中文注释。

处理方法:

在代码中增加 # -*- coding=UTF-8 -*- ，一般加在文件头部第一行，如果第一行是脚本标志，则放在第二行（实际仍然是python正本的第一行）.

随后将文件另存为UTF-8格式.

此方法可以解决注释中有中文，及字符串立即数中包含中文的问题.

2、unicode中文变量打印出来是乱码。

处理方法:

文件开始引入扩展库的部分加入以下3行代码.

 
    ? 
   
         import 
         sys 
        
         reload 
         (sys) 
        
         sys.setdefaultencoding( 
         'utf-8' 
         )

3、utf-8 及 gbk互相转换。

直接看代码:

 
    ? 
   
         #utf-8字符串转换成GBK（GB2312及其它编码也是这样用） 
        
         print 
         str 
         .decode( 
         'UTF-8' 
         ).encode( 
         'GBK' 
         ) 
        
         #gbk转换成utf-8 
        
         print 
         str 
         .decode( 
         'GBK' 
         ).encode( 
         'UTF-8' 
         )

4、参数中的utf-8是用大写还是小写?

通常大小写都可以，这不是python决定的，是系统的语言代码设定决定的.

5、打开utf-8的文本文件。

经过1、2的设置，正常直接打开就可以，文件是什么编码，读出来就是什么编码，个别仍有不行的可以使用扩展库codecs:

 
    ? 
   
         import 
         codecs 
        
         ... 
        
         with codecs. 
         open 
         (poetry_file,  
         "r" 
         , 
         "utf-8" 
         ) as f:

6、print打印出来的结构中的汉字是乱码。

print仅打印一个utf-8的变量是不会有问题的，比如。

但是如果用了接续显示，比如:

 
    ? 
   
         print 
         a, 
        
         #将会显示乱码

如果是其它结构，诸如dict / list / class等，都会出现乱码.

这种情况使用基本库没有什么好办法，只能循环逐个打印内容，比如:

 
    ? 
   
         ... 
        
         for 
         item  
         in 
         items: 
        
         print 
         item

或者整合输出，比如： print ', '.join(a) 。

还可以使用第三方的包，比如:

 
    ? 
   
         import 
         uniout 
        
         ... 
        
         listnine  
         = 
         [ 
         '梨' 
         ,  
         '橘子' 
         ,  
         '苹果' 
         ,  
         '香蕉' 
         ] 
        
         print 
         'listnine list: %s' 
         % 
         listnine

7、变量本身显示正常，循环遍历出来的单个字符乱码。

大多情况是因为字符串不是unicode编码。声明字符串的时候使用 a = u'汉字' 这样方式赋值的变量都是Unicode字符串，不会有问题.

如果是从外部传入的变量，源头情况又不知道，可以尝试转换成Unicode字符串:

 
    ? 
   
         str 
         = 
         unicode 
         ( 
         str 
         , 
         "utf-8" 
         );

嗯，差不多就这些，想到再补充.

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持我.

原文链接：http://www.cnblogs.com/andrewwang/p/8536261.html 。

最后此篇关于Python2中文处理纪要的实现方法的文章就讲到这里了,如果你想了解更多关于Python2中文处理纪要的实现方法的内容请搜索CFSDN的文章或继续浏览相关文章，希望大家以后支持我的博客！。

文章推荐： dnf手游公会怎么升级地下城与勇士手游公会升级攻略

文章推荐： Laravel 5.1 on SAE环境开发教程【附项目demo源码】

文章推荐： python实现冒泡排序算法的两种方法

文章推荐： ThinkPHP的SAE开发相关注意事项详解

javascript 中文/日文字符解码
我在服务器上创建了一个 JSONP 函数并像这样返回一个 UTF-8 编码的 json 对象 applyLocalization({"Name":"%E5%90%8D%E5%89%8D","Age":
string - 如何在Flutter中将Unicode字符串转换为正确的字符串(中文)
我正在开发一个应用程序，在该应用程序中我从API获取数据，并且正在获取这样的汉字 “u9c9cu82b1u548cu7231” 鲜花和爱如何转换？最佳答案您的字符串采用转义的unicode格式。
php - 中文/日文字母的正则表达式
好吧，我已经有了这个正则表达式，用于我网站上允许的名称。但是，我还希望添加名称可能使用的其他字母。有人有好的 regex 或知道如何使它更完整吗？我已经搜索了一段时间，但找不到适合我需要的内容。这是
php - 中文/日文字母的正则表达式
好吧，我已经有了这个正则表达式，用于我网站上允许的名称。但是，我还希望添加名称可能使用的其他字母。有人有好的 regex 或知道如何使它更完整吗？我已经搜索了一段时间，但找不到适合我需要的内容。这是
Yii框架多语言站点配置方法分析【中文/英文切换站点】
本文实例讲述了Yii框架多语言站点配置方法。分享给大家供大家参考，具体如下：这里假设我们要建立中文／英文切换的站点 1. 设置全局默认的语言文件添加代码：protected/confi
r - 如何在R中使用正确的(中文)编码下载网页文本
我想知道如何设置编码参数，以便当我下载文本时，它“看起来”与我在网络浏览器中的页面源代码中看到的一样，例如: readLines("http://www.baidu.com/s?wd=r+projec
unicode - 中文 <-> 英文翻译/字义数据库
我计划开发一个 web 应用程序，它将使用一种新颖的方式来帮助人们学习汉字并记住它们的含义。由于我不想/不能花费数年时间手动翻译所有中文字符，我想知道是否有(最好是开源的)数据库(任何形式)提供此功
javascript - 如何在html中渲染非英文字符(日语，中文)
我知道我的问题已经在这里有了解决方案。但我只想具体说明我的情况。我有一个 json 对象，其中包含非英语字符。例如。 {“my_chinise_name”:“吉米”}。该对象将通过 javascr
java - 中文(简体和繁体)和韩文文本的字符损坏
我有一个设置，其中邮件服务器(postfix)收到的电子邮件被处理，生成的电子邮件的正文(html或纯文本)和附件被解析为单独的文件并保存，为此我使用javax mail api。当电子邮件正文为中
django - 中文 django 翻译不起作用
我的 settings.py 看起来像这样: LANGUAGES = ( ('en', _('English')), ('fr', _('French')), #Simplif
python - QValueAxis 显示困惑的代码(中文)？
在我的图表中，x轴需要显示中文，y轴需要显示英文，但x轴显示困惑的代码。有人可以帮助我吗？ self.chart.createDefaultAxes() axis_x, axis_y = self.c
python - Beautifulsoup 返回奇怪的字符(中文)
使用Python3和BeautifulSoup v4 url='http://www.eurobasket2015.org/en/compID_qMRZdYCZI6EoANOrUf9le2.seaso
xcode - NSManagedObject 子类和应用程序名称(中文)
我的开发应用程序名称为中文。今天我从 CoreData 收到错误: CoreData: warning: Unable to load class named '￐ﾟ￐ﾣ￐ﾝ￐ﾚ.' for enti
java - 用java解析阿拉伯文/中文/日文RSS提要
我正在用 java 编写一个 rss feed 解析器，在解析包含阿拉伯文/中文/日文字符的 feed 时遇到了问题。 Example feed 当我打印它们时，我只是得到一组问号“?????? ??
python - 如何在python程序中比较非英文(中文)字符？
在我的一个Python程序(python 2.7)中，我需要处理一些汉字: 我有一个文件A.txt，它有两列:“name”和“score”，“name”列可以取一些中文字符串，score是一个1 到
android - 如何让android设备 "speak"中文？
我正在学习使用 eclipse 和 ADT 插件在 Android 上开发应用。根据android SDK 文档中的这篇文章http://androidappdocs.appspot.com/res
javascript - 中文 URL 编码问题
我有这样的中文文字:“回家” - 好像是英文的“house”。我去 google.com，在搜索中输入“回家”并得到这样的 url: http://www.google.ru/... q=%E5%9
ios - NSSortDescriptor 中文...怎么样？
我正在为我的应用程序添加中文支持。我有这条线可以对英语和其他语言进行排序 NSSortDescriptor *sortByItem = [NSSortDescriptor sortDesc
python - 打印日文(中文)字符
我读日语，想尝试处理一些日语文本。我使用 Python 3 尝试了这个: for i in range(1,65535): print(chr(i), end='') 然后 Python 给了
c# - 将文本框输入翻译成西类牙语、中文、德语
我想将文本框值翻译成特定语言，如西类牙语、中文、德语等，它们都在下面的下拉列表中，我想在标签中显示文本框翻译值，但不在标签中显示翻译值。 English J

qq735679552

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

Python2中文处理纪要的实现方法