python-2.7 - Python : ascii codec can't encode en-dash-6ren

python-2.7 - Python : ascii codec can't encode en-dash

转载作者：行者123 更新时间：2023-12-04 22:58:41

24

4

我正在尝试使用支持 CP437 编码的 thermal printer 从诗歌基金会的每日诗歌 RSS 提要中打印一首诗。这意味着我需要翻译一些字符；在这种情况下，连字符的短划线。但是 python 甚至不会编码开始的破折号。当我尝试解码字符串并用连字符替换破折号时，出现以下错误:

Traceback (most recent call last):
  File "pftest.py", line 46, in <module>
    str = str.decode('utf-8')
  File "/usr/lib/python2.7/encodings/utf_8.py", line 16, in decode
    return codecs.utf_8_decode(input, errors, True)
UnicodeEncodeError: 'ascii' codec can't encode character u'\u2013' in position 140: ordinal not in range(128)

这是我的代码:

#!/usr/bin/python
#-*- coding: utf-8 -*-

# This string is actually a variable entitled d['entries'][1].summary_detail.value
str = """Love brought by night a vision to my bed,
One that still wore the vesture of a child
But eighteen years of age – who sweetly smiled"""

str = str.decode('utf-8')
str = str.replace("\u2013", "-") #en dash
str = str.replace("\u2014", "--") #em dash
print (str)

我实际上可以在终端窗口 (Mac) 中使用以下代码打印输出而不会出错，但我的打印机会吐出 3 个 CP437 字符集:

str = u''.str.encode('utf-8')

我使用 Sublime Text 作为我的编辑器，并且我用 UTF-8 编码保存了页面，但我不确定这会有所帮助。我将不胜感激任何有关此代码的帮助。谢谢!

最佳答案

我不完全了解您的代码中正在发生的情况，但是我也一直尝试用连字符代替连字符，这些字符是从Web上获得的字符串，这对我有用。我的代码就是这样:

txt = re.sub(u"\u2013", "-", txt)

我正在使用 Python 2.7 和 Sublime Text 2，但我不想在我的脚本中设置 -*- coding: utf-8 -*-，因为我试图不引入任何新的编码问题。 (即使我的变量可能包含Unicode，我也希望将代码保持为纯ASCII。)是否需要在 .py文件中包括Unicode，还是只是为了帮助调试？

我会注意到我的 txt 变量已经是一个 unicode 字符串，即

print type(txt)

产生

<type 'unicode'>

我很想知道 type(str) 在你的情况下会产生什么。

我在你的代码中注意到的一件事是

str = str.replace("\u2013", "-") #en dash

你确定这有什么作用吗？我的理解是 \u 仅表示 u"" 字符串中的“unicode 字符”，而您创建的字符串包含 5 个字符、“u”、“2”、“0”等(第一个字符是因为您可以转义任何字符，如果没有特殊含义，例如 '\n' 或 '\t'，它只会忽略反斜杠。)

此外，您从打印机获得 3 个 CP437 字符这一事实让我怀疑您的字符串中仍然有破折号。 en-dash 的 UTF-8 编码是 3 个字节: 0xe2 0x80 0x93 。当您在包含短划线的 unicode 字符串上调用 str.encode('utf-8') 时，您会在返回的字符串中获得这三个字节。我猜你的终端知道如何将它解释为一个破折号，这就是你所看到的。

如果你不能让我的第一种方法起作用，我会提到我也成功了:

txt = txt.encode('utf-8')
txt = re.sub("\xe2\x80\x93", "-", txt)

如果你把它放在你调用 re.sub() 之后，那么 encode() 可能对你有用。在这种情况下，您甚至可能根本不需要对 decode() 的调用。我承认我真的不明白为什么它在那里。

关于python-2.7 - Python : ascii codec can't encode en-dash，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/33307690/

24

4

0

文章推荐： visual-studio-2015 - Visual Studio Community 2015 服务不可用

文章推荐： unity3d - 在 Unity3d 中如何检测 UI 上的触摸？

文章推荐： sql - 如何找出 Redshift 表中每列的大小？

文章推荐： delphi - LPLONG的Delphi等效项是什么？

groovy - geb 使用葡萄 - 下载失败 : commons-codec#commons-codec;1. 6!commons-codec.jar
我正在尝试使用 user guide 中的抓取示例运行 geb用于引入依赖项: $ cat my.groovy @Grapes([ @Grab("org.gebish:geb-core:0.9
codec - 如何在我的 Java 应用程序中使用 Opus-Codec
我阅读了很多关于 opus-codec 的内容，但我不明白如何在我的示例 Java 应用程序中使用它。是否有任何可用于 opus 的 .so 文件可以使用？如果没有，那么如何？最佳答案目前(在撰
maven - 访问被拒绝 : http://repo. maven.apache.org/maven2/commons-codec/commons-codec/1.4/commons-codec-1.4.pom，ReasonPhrase:Forbidden
我试图构建 Maven 项目，每当我在命令行上运行“mvn clean install”时，都会出现以下错误: 无法解析项目 com.my_project:jar:0.0.1-SNAPSHOT 的依
java.lang.NoClassDefFoundError : org/apache/lucene/codecs/Codec 错误
我有一个项目需要 Lucene(4.3.0) 并添加以下依赖项:lucene-core,lucene-analyzers-common,lucene-queries,lucene-queryparse
unit-testing - Grails 单元测试 : Json-Codec missing/How to mock Json-Codec?
我正在对 Controller 进行单元测试，目前我被服务(由 Controller 调用)中的“encodeAsJSON()”方法调用所困扰。我得到了 MissingMethodException
java - 是什么导致错误 ' A SPI class of type lucene.codecs.Codec name ' Lucene42'
无法弄清楚是什么原因导致 ' 名称为“Lucene42”的 org.apache.lucene.codecs.Codec 类型的 SPI 类不存在。您需要将支持此 SPI 的相应 JAR 文件添加到您
mongodb - org.bson.codecs.configuration.CodecConfigurationException : Can't find a codec for class [Ljava. lang.String;
我想运行以下命令来使用 MongoDB Java 驱动程序创建用户， client = new MongoClient(mongoClientURI); MongoDatabase d
java - 名称为 'Lucene54' 的 org.apache.lucene.codecs.Codec 类型的 SPI 类不存在
对于 lucene-core-5.5.2，我在 weblogic 服务器中遇到了问题 a。独立的搜索应用程序可以工作，但是当我部署为 WEB APP 时，它失败并出现以下错误 Exception ty
java - MongoDB jodatime : org. bson.codecs.configuration.CodecConfigurationException : Can't find a codec for class org. joda.time.DateTime
我的代码: DateTime dateTime = new DateTime(); BasicDBObject oldDoc = new BasicDBObject("email",email); B
java - org.bson.codecs.configuration.CodecConfigurationException : Can't find a codec for class org. hibernate.ogm.datastore.mongodb.type.GridFS
我正在尝试在 Hibernate-ogm 中尝试 GridFS。这就是我的课 import org.hibernate.ogm.datastore.mongodb.type.GridFS; @Embe
mongodb - org.bson.codecs.configuration.CodecConfigurationException : Can't find a codec for class org. springframework.data.mongodb.core.query.GeoCommand
我正在使用如下聚合: final List aggregations = new ArrayList<>(); Polygon polygon = new Polygon(new Po
java - 异常 : java. lang.IllegalArgumentException : An SPI class of type org. 名称为 'Lucene410' 的 apache.lucene.codecs.Codec 不存在
我正在处理一个多模块 gradle 项目(12 个模块)。我继承了该项目，需要更新其中使用的一些库的版本。我无法理解此错误的原因: ... 67 more Caused by: java.l
java - MongoDB Java 插入抛出 org.bson.codecs.configuration.CodecConfigurationException : Can't find a codec for class io. github.ilkgunel.mongodb.Pojo
我正在使用 Java 学习 MongoDB。我正在尝试使用 Java 驱动程序将数据插入 MongoDB。我正在像 MongoDB 教程中一样进行插入，而且一切都很好。但是如果我想插入一个变量，当我运
python - codecs.ascii_decode(输入，self.errors)[0] UnicodeDecodeError : 'ascii' codec can't decode byte 0xc2 in position 318: ordinal not in range(128)
我正在尝试打开并读取包含大量文本的 .txt 文件。下面是我的代码，我不知道如何解决这个问题。任何帮助将不胜感激。 file = input("Please enter a .txt file: ")
python - pip install django-toolbelt 报错:"codecs.ascii_decode(input, self.errors)[0] UnicodeDecodeError: ' ascii' codec can't decode byte 0xc2
我使用 Arch Linux 和默认的 Python 3。我使用 Konsole 通过命令 pip install django-toolbelt 下载 django-toolbelt。名称: pip
codec - FFMPEG中帧和包的区别
我正在尝试使用 LibAV 解码 mpeg 视频文件。有两个术语我无法正确理解，镜框和数据包 . 按照我目前的理解，镜框是未压缩的视频帧和数据包是压缩帧。问题 : 数据包有多个帧，对吗？一
codec - DICOM 像素数据压缩解压能否搞乱窗口中心和窗口宽度
我正在查看计算机断层扫描 (CT) DICOM 图像。这些最初是未压缩的 DICOM 图像。我有这些 DICOM 图像的无损 J2K 压缩形式:传输语法 = 1.2.840.10008.1.2.4.9
java - 如何安装Commons Codec？
如何安装通用编解码器？我已经下载了，但是我在网上搜索过，找不到这个问题的答案。我想使用 Base64 编码器和解码器。还有 1 个问题，如果我的代码使用这个编解码器，其他尝试使用我的程序的用户是否也
loci.formats.codec.ZlibCodec类的使用及代码示例
本文整理了Java中loci.formats.codec.ZlibCodec类的一些代码示例，展示了ZlibCodec类的具体用法。这些代码示例主要来源于Github/Stackoverflow/Ma
hivemall.utils.codec.ZigZagLEB128Codec类的使用及代码示例
本文整理了Java中hivemall.utils.codec.ZigZagLEB128Codec类的一些代码示例，展示了ZigZagLEB128Codec类的具体用法。这些代码示例主要来源于Githu

首页

博学

6Ren·AI

商城

python-2.7 - Python : ascii codec can't encode en-dash