python - Numpy CSV fromfile()-6ren

python - Numpy CSV fromfile()

转载作者：行者123 更新时间：2023-12-01 01:09:03

25

4

我可能想在这里重新发明轮子，但是 numpy 有一个 fromfile() 函数，可以读取 - 我想 - CSV 文件。

它的速度似乎令人难以置信 - 即使与 Pandas read_csv() 相比，但我不清楚它是如何工作的。

这是一些测试代码:

import pandas as pd
import numpy as np

# Create the file here, two columns, one million rows of random numbers.
filename = 'my_file.csv'
df  = pd.DataFrame({'a':np.random.randint(100,10000,1000000), 'b':np.random.randint(100,10000,1000000)})
df.to_csv(filename, index = False)

# Now read the file into memory.
arr = np.fromfile(filename)

print len(arr)

我在末尾添加了 len() 以确保它不只读取一行。但奇怪的是，我的长度(根据随机数生成而变化)是 1,352,244。啊？

The docs显示可选的 sep 参数。但当使用它时:

arr = np.fromfile(filename, sep = ',')

...我们得到的长度为 0？!

理想情况下，我能够从此 CSV 文件加载二维数组，但我会选择此 CSV 文件中的单个数组。

我在这里缺少什么？

最佳答案

numpy.fromfile 不是用于读取 .csv 文件，而是用于读取使用 numpy.ndarray.tofile 方法写入的数据。

来自文档:

A highly efficient way of reading binary data with a known data-type, as well as parsing simply formatted text files. Data written using the tofile method can be read using this function.

通过在没有 sep 参数的情况下使用它，numpy 假设您正在读取二进制文件，因此长度不同。当您指定分隔符时，我猜该函数就会中断。

要使用numpy读取.csv文件，我认为您可以使用numpy.genfromtext或numpy.loadtxt(来自此question) .

关于python - Numpy CSV fromfile()，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55031526/

25

4

0

文章推荐： jquery - fancybox 2 - 重新加载页面

文章推荐： jQuery Datepicker UI 仅在单击关闭按钮或完成按钮时关闭

文章推荐： javascript - Vue.js 切换从父级扩展 v-for 组件

Scala 'fromFile' 怪异？
我不明白为什么有两段代码要做完全相同的事情，却在 Scala 中做不同的事情。第一个例子: scala> val ggg = Source.fromFile("/somefile"); ggg: s
c# - .FromFile 带有红色下划线并显示错误
我想创建一个 Windows 窗体，它从文件中获取图像并显示在 C# 的 pictureBox 中当我在“=”之后键入 image.FromFile 时遇到问题，FromFile 变成红色下划线，就好
.NET:Image.FromFile() 可以处理哪些图像文件类型？
我使用 Image.FromFile() 读取用户上传的图像文件。对于“选择文件”对话框，我可以允许哪些文件扩展名？谢谢! 最佳答案来自微软的文档:http://msdn.microsoft.co
scala - Source.fromFile 的效率
我想知道以下代码片段的效率是多少: val lst = Source.fromFile(f).getLines.toList 发出lst.contains(x)时，这是否意味着f正在被重新扫描，或者
python - Numpy CSV fromfile()
我可能想在这里重新发明轮子，但是 numpy 有一个 fromfile() 函数，可以读取 - 我想 - CSV 文件。它的速度似乎令人难以置信 - 即使与 Pandas read_csv() 相比
python - Numpy fromfile 的两种实现？
我正在尝试更新一些在方法中使用 np.fromfile 的旧代码。当我尝试在 numpy 源中搜索此方法时，我只找到 np.core.records.fromfile ，但是当您搜索文档时，您可以找到
python - 如何模拟 numpy.fromfile？
我正在尝试向 numpy.fromfile 传递一个模拟的 file，但我不断收到以下错误: IOError: !first argument must be an open file 这是一个基本示
python - np.fromfile 文件大小的最大限制？
np.fromfile() 是否有最大文件大小？我正在尝试读取一个 48GB 的文件，其中包含大约 2.1e9 条记录(每条记录有 5 个值)。当我将计数限制为 8e7 时它起作用了: from
python - numpy fromfile 和结构化数组
我正在尝试使用 numpy.fromfile阅读structured array (文件头)通过传入 user defined data-type .出于某种原因，我的结构化数组元素以二维数组而不是平
python - numpy.fromfile 中的参数计数无效
这个问题可能是微不足道的，但我真的不知道如何解决它。假设我使用 np.int64 类型生成一个大小为 (4,3) 的 numpy 数组，然后写入二进制文件。该数组如下所示: [[ 1 2 3]
linux - inotify --fromfile 指令
我有一个带有 xfce 窗口管理器的系统 fedora 15。我安装了一个 inotify 工具来玩。我想控制我的文件在我的工作过程中会发生什么。我今天使用一个命令来运行 inotify inot
python - 压缩文件上的高效 numpy.fromfile？
我有一些大文件(甚至压缩到 10GB 左右)，其中包含一个 ASCII header ，然后原则上每个大约 3MB 的 numpy.recarrays，我们称它们为“事件”。我的第一种方法是这样的:
c# - 内存不足 Image.FromFile
为什么我会遇到内存不足的错误？谢谢 if (File.Exists(photoURI)) { FileStream fs = new FileStream(photoURI, FileMode
python - 使用 Numpy fromfile 和给定的偏移量读取二进制文件
我有一个二进制文件，其中包含飞机位置的记录。每条记录如下所示: 0x00: Time, float32 0x04: X, float32 // X axis position 0x08: Y, flo
scala - 为什么此代码与 Enumerator.fromFile 一起成功运行？
我写的文件传输代码如下: val fileContent: Enumerator[Array[Byte]] = Enumerator.fromFile(file) val size = file.le
java - Scala Source.fromFile 内存消耗
全部，我有一个只有 ~120MB 的 CSV 文件(将其命名为 demo.csv) 以下代码会导致堆从正常大小的 100MB 膨胀到 1.7GB，尽管加载的底层数据只有 120MB 我可以在哪些方面
c# - FileNotFound 当我使用 Image.FromFile()
我在这种情况下使用 Image.FromFile(string) 方法: using System; using System.Collections.Generic; using System.Co
c# - Image.FromFile，未找到 [但它在那里]
它和我想象的一样奇怪。 o.0. 我已经检查并仔细检查了，甚至不明白为什么它不起作用... 下面是使用的代码: try { if (!(Directory.Exists(@"C:\Simple
Python fromfile 在读取使用 tofile 生成的二进制文件时返回不正确的值
我发现了几个类似的问题，但没有一个能准确描述我面临的问题。我有一个 OBJ 文件，其中包含描述顶点位置的行: v 0.01214 0.4242 0.82874 我想将此数据转换为 matlab 友好的
python - numpy:gzipped 文件的 fromfile
我正在使用 numpy.fromfile 构建一个数组，我可以将其传递给 pandas.DataFrame 构造函数 import numpy as np import pandas as pd de

首页

博学

6Ren·AI

商城

python - Numpy CSV fromfile()