- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
使用 NumPy loadtxt
和 savetxt
只要涉及非 ASCII 字符,函数就会失败。这些函数主要用于数字数据,但也支持字母数字页眉/页脚。
两者都是 loadtxt
和 savetxt
似乎正在应用 latin-1 编码,我发现它与 Python 3 的其余部分非常正交,Python 3 完全支持 unicode,并且似乎总是使用 utf-8 作为默认编码。
鉴于 NumPy 尚未将 utf-8 作为默认编码,我是否可以通过一些已实现的函数/属性或已知的 hack,至少将编码从 latin-1 更改为 loadtxt
/savetxt
还是整个 NumPy?
这在 Python 2 中是不可能的,这是可以原谅的,但在使用 Python 3 时它真的不应该成为问题。我发现使用 Python 3.x 和最近许多版本的 NumPy 的任意组合都存在问题。
考虑文件 data.txt
与内容
# This is π
3.14159265359
尝试加载它
import numpy as np
pi = np.loadtxt('data.txt')
print(pi)
失败并返回 UnicodeEncodeError
异常,说明 latin-1 编解码器无法对字符“\u03c0
”进行编码'(π
字符)。
这令人沮丧,因为 π
仅出现在评论/标题行中,因此没有理由 loadtxt
甚至尝试对这个字符进行编码。
我可以通过使用 pi = np.loadtxt('data.txt', skiprows=1)
显式跳过第一行来成功读入文件, 但必须知道标题行的确切数量是不方便的。
如果我尝试使用 savetxt
来编写一个 unicode 字符,则会抛出相同的异常。 :
np.savetxt('data.txt', [3.14159265359], header='# This is π')
为了成功完成这项任务,我首先必须通过其他方式写入文件头,然后将数据保存到用'a+b'
打开的文件对象中。模式,例如
with open('data.txt', 'w') as f:
f.write('# This is π\n')
with open('data.txt', 'a+b') as f:
np.savetxt(f, [3.14159265359])
不用说,这既丑陋又不方便。
我选择了 hpaulj 的解决方案,我认为最好完整地说明一下。我现在做的接近我程序的顶部
import numpy as np
asbytes = lambda s: s if isinstance(s, bytes) else str(s).encode('utf-8')
asstr = lambda s: s.decode('utf-8') if isinstance(s, bytes) else str(s)
np.compat.py3k.asbytes = asbytes
np.compat.py3k.asstr = asstr
np.compat.py3k.asunicode = asstr
np.lib.npyio.asbytes = asbytes
np.lib.npyio.asstr = asstr
np.lib.npyio.asunicode = asstr
之后np.loadtxt
和 np.savetxt
正确处理 Unicode。
请注意,对于较新版本的 NumPy(我可以确认 1.14.3,但也有一些较旧的版本)不需要此技巧,因为现在默认情况下似乎可以正确处理 Unicode。
最佳答案
至少对于 savetxt
编码是在
Signature: np.lib.npyio.asbytes(s)
Source:
def asbytes(s):
if isinstance(s, bytes):
return s
return str(s).encode('latin1')
File: /usr/local/lib/python3.5/dist-packages/numpy/compat/py3k.py
Type: function
Signature: np.lib.npyio.asstr(s)
Source:
def asstr(s):
if isinstance(s, bytes):
return s.decode('latin1')
return str(s)
File: /usr/local/lib/python3.5/dist-packages/numpy/compat/py3k.py
Type: function
header 被写入wb
文件
header = header.replace('\n', '\n' + comments)
fh.write(asbytes(comments + header + newline))
Write numpy unicode array to a text file有我以前的一些探索。在那里我关注的是数据中的字符,而不是标题。
关于python - 使用 NumPy loadtxt/savetxt 指定编码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41528192/
我有一个模拟文件,内容如下: 5.2000 -0.01047 -0.02721 0.823400 -0.56669 1.086e-5 2.109e-5 -1.57e-5 -3.12e-5
我有一个文本文件,我想使用 loadtext() 将其加载到 NumPy 数组中。该文件是制表符分隔的,有时我在最后一个制表符后面有一个值而不是空: Value1\tab\Value2\tab\val
我必须在一个巨大的文本文件中获取特定的行。到目前为止我尝试如下。我的目标是提取特定迭代的列,这里每 500 行。但通过继续执行“readlines”,有时我会因为文件的大小(直到 4Gb)而遇到一些崩
我有一个简单的 python 脚本来读取数据文件并绘制它。这是: #!/usr/bin/python import sys import os import matplotlib.pyplot as
我尝试使用convert函数将String转换为float,我使用python3.6: 功能是: def datatype(s): it={'N':0,'L':1,'H':2} ret
这个问题已经有答案了: numpy Loadtxt function seems to be consuming too much memory (2 个回答) 已关闭 3 年前。 我有一个numpy
我想加载具有以下格式的txt: 20-Sep-13,178.90,185.83,178.56,183.39,13401689 19-Sep-13,170.80,180.47,169.08,177.92
我有一个看起来像这样的文件: some text the grids are 3 x 3 more text matrix marker 1 1 3 2 4 7 4 2 9 1 1 ne
我相信这个线程的标题解释了我在寻找什么。我很想知道跳过多行的语法是什么;我似乎无法在任何地方找到此类信息。 最佳答案 使用帮助(np.loadtxt)。您会发现 skiprows 参数将允许您跳过前
我正在尝试读取一个包含以下形式的复数的文件: data.dat 1.5795219122457646E-11-3.852906516379872E-15i -3.5949335665378405E
出于某种原因,我将代码分为两部分;第一部分是用 C 编写的,第二部分是用 python 编写的。我在文件中编写了 C 代码的输出并在 python 中使用它作为我的输入,现在我的问题是当我想将文件加载
我想用 numpy.loadtxt 读取 CSV 文件。我知道我可以使用 usecols 参数指定要读取的列。然而,我真正想要做的是指定一个列列表不来阅读。这是因为我实际上并不知道我的文件将包含多少列
我正在尝试使用 numpy.loadtxt 加载数据...我尝试读取的文件使用 cp1252 编码。是否可以使用 numpy 将编码更改为 cp1252? 以下内容 import numpy as n
似乎遇到了一个简单的问题。我正在尝试读取文件中的数组。这些列是整数和字符串的混合;只对第 0、2、3 列感兴趣。 import numpy as np network = np.loadtxt('te
我已经设法让 loadtxt 读取单个文件,但现在我想让它从我拥有的 .list 文件中读取一堆文件。我试着把它放在一个 for 循环中,但我似乎无法让它工作。有人可以帮忙吗? [row1, row2
我有一个 csv 文件,它的前三列是这样的 2011,12,25,... 2011,12,26.... 2011,12,27,... ... 这些列基本上是年月日。其他列包含字符串。总共有 100 行
我正在尝试使用 python matplotlib 从文本文件中绘制两列,但我得到了 ValueError: invalid literal for float(): 148.000000; 这是我的
我想在 python 中读取如下文本文件 文本文件示例 {# "Column 4-5 Quantity": "Re/Im Pressure" # "Column 4-5 Units": "" #
我有一个数据文件,可能是一行或多行。我使用 numpy.loadtxt 读取它。这具有使我的单行数据成为标量的功能。这是有问题的,因为我想在读入后使用循环。看下面的例子 $ cat file1 1 $
我正在尝试读取如下所示的文件: 1, 2, 3, 4, 我正在使用以下行: l1,l2 = numpy.loadtxt('file.txt',unpack=True,delimiter=', ') 这
我是一名优秀的程序员,十分优秀!