- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我已经读过这个:
Setting the correct encoding when piping stdout in Python
我正在尝试坚持经验法则:“始终在内部使用 Unicode。解码您收到的内容,并对您发送的内容进行编码。”
所以这是我的主文件:
# coding: utf-8
import os
import sys
from myplugin import MyPlugin
if __name__ == '__main__':
c = MyPlugin()
a = unicode(open('myfile.txt').read().decode('utf8'))
print(c.generate(a).encode('utf8'))
让我感到不安的是:
unicode(open('myfile.txt').read().decode('utf8'))
agréable, déjÃ
之类的东西。因此,如果我删除 encode('utf8')
(将最后一行更改为 print(c.generate(a))
然后它可以与 Pycharm 一起使用,但不会不再使用 Linux,我得到:'ascii' codec can't encode character u'\xe9' in position
blabla 你知道这个问题。如果我在命令行中尝试:
import sys sys.stdout.encoding
我得到 'UTF-8'
import sys sys.stdout.encoding
我得到None
WTF??import sys sys.stdout.encoding
我得到 'windows-1252'
最好的编码方式是什么,以便它适用于两种环境?
最佳答案
您的哲学是正确的,但您过度复杂化了事情并使您的代码变得脆弱。
以文本模式打开文件,自动为您转换为 Unicode。然后在没有编码的情况下打印 - 打印应该计算出正确的编码。
如果您的 Linux 环境设置不正确,请在您的 Linux 环境变量中设置 PYTHONIOENCODING=utf-8
(export PYTHONIOENCODING=utf-8
) 来修复打印过程中的任何问题。您应该考虑将区域设置设置为 UTF-8 变体,例如 en_GB.UTF-8
,以避免必须定义 PYTHONIOENCODING
。
PyCharm 无需修改即可工作。
您的代码应如下所示:
import os
import sys
import io
from myplugin import MyPlugin
if __name__ == '__main__':
c = MyPlugin()
# t is the default
with io.open('myfile.txt', 'rt', encoding='utf-8') as myfile:
# a is now a Unicode string
a = myfile.read()
result = c.generate(a)
print result
如果您使用的是 Python 3.x,请从 io.open()
中删除 import io
和 io.
。
关于Python 2.7 unicode 再次困惑,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32870303/
之前有人问过这个问题,但是当移动到具有相反字节序的平台(在这种情况下从大到小)时,我仍然对如何处理位域结构感到有些困惑。所以如果我有这个: typedef struct { unsigned
我之前问过这个问题here , 但它被标记为重复并已关闭。不幸的是,我被指出的答案不起作用.... 所以,再次: 我可以生成一个像这样的 eCharts4r 仪表 library(echarts4r)
关于 .NET 中对不可为空引用类型的支持存在很多问题。最大的希望是代码契约,但它仅限于对预算有限的人进行运行时检查。 对于代码契约以外的方法,Jon Skeet 写了一篇 blog post几年前,
当我通过将终止标志设置为true来停止线程'srch_slave_thread'时,(srch_slave_thread.terminate)释放线程的线程停止在析构函数的'inherited'行中,
We know that Windows 使用 CR + LF 对作为换行符,Unix(包括 Linux 和 OS X)使用单个 LF,而 MacOS 使用单个 CR。 这是否意味着 C 和 C++
This other SO question询问 WPF 中的自动完成文本框。有几个人已经构建了这些,其中给出的答案之一表明 this codeproject article . 但我还没有找到任何与
这个问题对我来说就像是噩梦的重演。该项目是使用 gpt3 训练聊天机器人,我正在试验嵌入。 我有文档,我正在尝试为不同的部分创建嵌入。根据我的测试,getEmbeddings() 似乎返回了一个值。但
我收到数据读取器初始化错误。我知道这个问题以前已经回答过很多次了,但这些案例似乎不适合我的情况。错误消息开头为“执行读取器:连接属性尚未初始化。” 程序: using System; using Sy
我知道这个问题已被多次询问和回答,但我正在抓狂,因为所提出的解决方案似乎都不起作用。 尽管有一个有效的配置文件,据我所知,它与 bundle 标识符匹配,但我收到了上述错误: 我已按照本网站上各种建议
所以我有一个小问题 这是我的文字 AFTER_2011/03/01 GREATER_2004_NOT 我想要 AFTER 和 GREATER,所以我有以下正则表达式: [A-Z]{2,}\\B 一开始
这个问题对我来说就像是噩梦的重演。该项目是使用 gpt3 训练聊天机器人,我正在试验嵌入。 我有文档,我正在尝试为不同的部分创建嵌入。根据我的测试,getEmbeddings() 似乎返回了一个值。但
我目前正在做具有图形功能的计算器应用程序。然后,我在我的计算器中有这个按钮,并将它连接到我的 Calculator2ViewController 上。此外,我将此按钮连接到另一个名为 GraphVie
昨天,我尝试以一种方式执行此操作...今天我尝试另一种方式,但仍然卡住了。我必须找到一种使用整数除法和取模来做到这一点的方法。这是我的代码,后面是错误消息。 public int evaluateFr
我大致正在处理以下内容: var i; var k = 5; $('document').ready(function () { $('#someElement').click(functio
又是realloc的问题。看来我在之前的很多realloc语句中都没有发现类似的问题。我将不胜感激您的兴趣。 我正在尝试读取格式的文本输入: g:;0,1,0,1,0 。我在源文本文件中有一组这种格式
我不知道为什么下面会给我:*“error LNK2001: unresolved external symbol 'struct Win32Vars_t win32' (?win32@@3UWin32
又是我。在我所有的问题中,我认为这是所有问题中最愚蠢的,但由于疲劳或愚蠢,我也需要一些帮助。然而,最重要的是,我这样做是为了我的一项任务,并且有一个严格的规则 - 我必须使用一个函数调用 char*
在 Ubuntu 14.04.5 上运行 MySql 5.5.53。当从文本文件导入数据时(加载数据 infil $FIL INTO TABLE &c),我收到可怕的提示,因为 secure_file
我在 Stackoverflow 中找到了大量关于如何选择组中第一行和最后一行的示例,但我无法根据需要调整它们。唉,我对 MySQL 的有限了解无济于事。 一些数据(date_time、val1 和
我遇到错误“连接必须有效并再次打开,当我更改我的 sql 查询代码时。任何人都可以帮忙吗??(编辑)在 form1 中我已经连接到数据库,在 form2 中我试图添加查询。 //IN Class1.c
我是一名优秀的程序员,十分优秀!