python - 为什么 Emacs 将我的文字 Unicode 字符串弄错了？-6ren

python - 为什么 Emacs 将我的文字 Unicode 字符串弄错了？

转载作者：行者123 更新时间：2023-12-01 05:33:29

据我所知，这些在使用 UTF-8 作为默认编码的系统中应该是等效的:

pattern1 = 'Wörterbuch Wortformen'.decode('utf8')
pattern2 = u'Wörterbuch Wortformen'

但是，当我将这些行从 Emacs 缓冲区发送到 Python 进程 (M-x python-shell-send-region) 时，会发生一些奇怪的事情。

>>> pattern1
u'W\xf6rterbuch Wortformen'
>>> pattern2
u'W\xc3\xb6rterbuch Wortformen'

在终端中运行的 Python shell 中，这两行结果都是 u'W\xf6rterbuch Wortformen'。

这是怎么回事？

我的区域设置配置为使用 UTF-8。

最佳答案

这是我所做的(稍后可能会有所帮助):

<小时/>

结论:您的缓冲区中包含源代码的编码系统需要为 utf-8 才能发送 ö 的两个字节。但是，如果它是单字节编码，并且您选择将字节 F6 映射到 ö 的区域设置，您将获得该字节。

PS。确保您有 -*-coding: utf-8 -*- 注释。

关于python - 为什么 Emacs 将我的文字 Unicode 字符串弄错了？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/19648263/

文章推荐： python csv标题不在第一行

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章