python - np.genfromtxt 多个分隔符？-6ren

python - np.genfromtxt 多个分隔符？

转载作者：太空宇宙更新时间：2023-11-04 07:58:24

24

4

我的文件是这样的:

1497484825;34425;-4,28,-14;-4,28,-14;-4,28,-14;-4,28,-14;-4,28,-14;-4,28,-14
1497484837;34476;-4,28,-14;-4,28,-14;-4,28,-14;-4,28,-14;-4,28,-14;-4,28,-14

我想使用 np.genfromtxt 将它导入到 numpy 数组中。最大的问题是它有';'和 ',' 作为分隔符。我的尝试:

import numpy as np
import io

s = io.StringIO(open('2e70dfa1.csv').read().replace(';',','))

data = np.genfromtxt(s,dtype=int,delimiter=',')

我得到错误:

TypeError: Can't convert 'bytes' object to str implicitly

如何解决？我也乐于接受全新的(更好的)想法。

最佳答案

根据docs :

Parameters:
fname : file, str, pathlib.Path, list of str, generator File, filename, list, or generator to read. If the filename extension is gz or bz2, the file is first decompressed. Note that generators must return byte strings in Python 3k. The strings in a list or produced by a generator are treated as lines.

给它一个生成器可能更容易也更有效，只是要记住它必须产生字节串:

>>> with open('2e70dfa1.csv', 'rb') as f:
...     clean_lines = (line.replace(b';',b',') for line in f)
...     data = np.genfromtxt(clean_lines, dtype=int, delimiter=',')
...
>>> data
array([[1497484825,      34425,         -4,         28,        -14,
                -4,         28,        -14,         -4,         28,
               -14,         -4,         28,        -14,         -4,
                28,        -14,         -4,         28,        -14],
       [1497484837,      34476,         -4,         28,        -14,
                -4,         28,        -14,         -4,         28,
               -14,         -4,         28,        -14,         -4,
                28,        -14,         -4,         28,        -14]])

关于python - np.genfromtxt 多个分隔符？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/44757160/

24

4

0

文章推荐： python - 读取文件并将内容插入字典

文章推荐： c - 如何在 C 中创建一个新的列表头？

python - Genfromtxt 文件名
我正在尝试读取以字符串形式存储在数据文件中的文件名。那里没问题。如果我将它传递给 genfromtxt，我会收到错误“IOError:Z:\Python\Rb input.txt not found”
Python genfromtxt 文件路径
我对 numpy.genfromtxt 函数有一个非常基本的问题。我正在使用 Enthought Canopy 包:我应该在哪里保存我想使用的 file.txt，或者我应该如何告诉 Python 在哪
Python genfromtxt 多种数据类型
我想使用 genfromtxt 读取一个 csv 文件。我有六列是 float ，一列是字符串。如何设置数据类型，以便将 float 列作为 float 读入，将 string 列作为字符串读入？我
python - genfromtxt 加载排列成行的数据
我有以下格式的数据 csv 文件: 130, 706, 249, 627, 428, 767, 430, 63, 884, 593 964, 340, 848, 607, 142, 517, 294
python - genfromtxt 创建元组的一维数组而不是二维数组
我正在尝试使用 scikit-learn 进行一些分类。但是，我在开始工作和导入数据时遇到了麻烦。我正在处理这些数据:Adult Data Set . 我是 numpy 和 scikit-learn
python - 在单个文件上使用多个 genfromtxt
我是 Python 的新手，目前在处理我的输入文件读取时遇到问题。基本上我希望我的代码采用一个输入文件，其中相关信息包含在 4 行的 block 中。对于我的特定目的，我只关心每个 block 的第
numpy - 跳过 genfromtxt 中的行
我有下表: 2M00251602+5422547 7.180 9.000 2.200 #2M00255540+5749320
python - 内存错误 : numpy. genfromtxt()
我有一个 50,000x5,000 矩阵(浮点)文件。当使用 x = np.genfromtxt(readFrom, dtype=float) 将文件加载到内存中时，我收到以下错误消息: File "
python - 使用 genfromtxt 加载数据时如何替换值
我想知道当从具有多列的给定 (csv) 文件加载数据时如何替换特定值，结合字符串和数值。在下面的示例中，假设您有多个地理位置，具有已知的纬度和经度以及一组特定的属性 (P1-P5) 和一个类(仅包含
python - 强制 genfromtxt 输出为无向量
在只加载一列数据的情况下，有没有办法强制 genfromtxt 输出形状为:(xx, 1) 的数据？通常的形状是(xx，)。我的示例中的 xx 可以是任何整数。更新:这是代码示例: import n
python - np.genfromtxt 不会生成二维数组
我有一个 csv 文件，其中包含: 0812,EP2463,R,FEIGE 0812,EP2466,R,FEIGE 0816,EP2462,R,FEIGE 0816,EP2460,R,FEIGE 我需
python - numpy.genfromtxt 没有解包
我的包 numpy.genfromtxt 有一个奇怪的问题.我用它来读取包含多个列(可用 here )的数据文件，但即使 unpack 设置为 True，这些文件也不会被解压。这是一个MWE: im
python - 使用 "genfromtxt"提取列
在问这个问题之前我已经阅读了这两个问题( q1 和 q2 )但是我没有找到任何令人满意的答案我需要从二维数组中提取两列，而不是使用 pandas 或 loadtxt，而是使用 genfromtxt
Python:numpy.genfromtxt - 需要包含无效字符的列名
我正在使用 numpy.genfromtxt 导入 CSV 文件。要导入的数据有一个列名的标题，其中一些列名包含 genfromtxt 认为无效的字符。具体来说，一些名称包含“#”和“”。输入数据无
python - np.genfromtxt 多个分隔符？
我的文件是这样的: 1497484825;34425;-4,28,-14;-4,28,-14;-4,28,-14;-4,28,-14;-4,28,-14;-4,28,-14 1497484837;34
python - 使用 genfromtxt 拆分数据
使用 Python，我使用 genfromtxt(来自 numpy)将文本文件读入数组: y = np.genfromtxt("1400list.txt", dtype=[('mystring','S
python - numpy.genfromtxt 错误地解析带有转义字符的列名
我正在使用以下代码从 CSV 文件中读取大量数据 data = np.genfromtxt(inputfile.name, delimiter=',', dtype=float, names=True
python - numpy.genfromtxt()，skiprows和skip_header有什么区别？
我以为 genfromtxt() 会跳过 skip_header+skiprows，但事实并非如此。如果 skiprows 处于事件状态，则忽略 skip_header。它们有什么区别？最佳答案
python - Numpy genfromtxt 遍历列
我正在使用 NumPy 的 genfromtext 从 CSV 文件中获取列。每一列都需要拆分并分配给单独的 SQLAlchemy SystemRecord 与其他一些列和属性结合并添加到数据库中。
python - 跳过 genfromtxt 中缺失值的行
如何加载 csv。当至少一个单元格为空时，将文件放入一个跳过行的数组中？我的 csv 文件很大(超过 1000 行和 14 列): 1;4;3 ;1;3 ;;6 3;4;7 我想跳过第 2 行和第 3

首页

博学

6Ren·AI

商城

python - np.genfromtxt 多个分隔符？