python - 如何让 python 在读写 Unicode 文本文件时更加友好？-6ren

python - 如何让 python 在读写 Unicode 文本文件时更加友好？

转载作者：太空宇宙更新时间：2023-11-04 11:03:50

24

4

我发现即使是现代 Python 版本(如 3.x)也无法检测文本文件上的 BOM。我想知道是否有任何模块可以通过替换用于读取和写入文本的 open() 和 codecs.open() 函数来将此缺失的功能添加到 Python文件。

最佳答案

建议的解决方案here对我来说仍然不错(这里是该代码的修改版本，仍然在 Python 2 中，而不是 Python 3 中，并且有一个用法示例):

#!/usr/bin/python
# -*- coding: utf-8 -*-

import codecs, logging, sys
logging.basicConfig(level=logging.INFO)
bomdict = {
    codecs.BOM_UTF8 : 'UTF8',
    codecs.BOM_UTF16_BE : 'UTF-16BE',
    codecs.BOM_UTF16_LE : 'UTF-16LE' }

def read_unicode(filename):
  the_text = open(filename, 'r').read()
  for bom, encoding in bomdict.items():
      if the_text.startswith(bom):
          logging.info('BOM found, using %s', encoding)
          the_text = the_text[len(bom):]
          break
  else:
      logging.info('No BOM, using utf8')
      encoding = 'UTF8'
  return the_text.decode(encoding)

f = open('x.txt', 'wb')
f.write(codecs.BOM_UTF16_LE)
f.write(u'zeé fóo!'.encode('UTF-16LE'))
f.close()

print read_unicode('x.txt')

关于python - 如何让 python 在读写 Unicode 文本文件时更加友好？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/3038034/

24

4

0

文章推荐： java - 无法找到或加载主类

文章推荐： java - 使用套接字从 Android 设备连接到 ESP8266

文章推荐： python - 使用 Python 从 Youtube 下载视频

java - 使现有 API 更加 RESTful
关闭。这个问题是opinion-based 。目前不接受答案。想要改进这个问题吗？更新问题，以便 editing this post 可以用事实和引文来回答它。 . 已关闭 4 年前。 Improv
grails - 让 Grails Controller 更加 DRY？
我正在寻找清理 Grails Controller 代码的方法。在各种 Controller 中我或多或少有相同的逻辑.. 获取对象检查是否存在等等.. 是否有建议的方法可以使 Controlle
java - 如何使 PHP 更加 Javatized(又名强类型，更健壮)？
我真的很喜欢 PHP，因为: _ 易于开发 Web 应用程序(您可以在 10 分钟内设置 LAMP，然后就可以开始了) _ 简单易学 _ 易于部署(您只需要带有 PHP 模块的 Apache) 我真的
php - 使用 mod_rewrite 使博客 URL 更加 SEO 友好
我正在尝试使用 mod_rewrite 将我的博客 URL 转换为更适合 SEO 的格式。我所有的文章都存储在一个简单的 MySQL 数据库中。每个博客文章的网址如下所示: http://www.te

首页

博学

6Ren·AI

商城

python - 如何让 python 在读写 Unicode 文本文件时更加友好？