python - 读取交错数据的快速方法？-6ren

python - 读取交错数据的快速方法？

转载作者：太空狗更新时间：2023-10-29 20:20:46

26

4

我有一个包含多个数据通道的文件。文件以基本速率采样，每个 channel 以该基本速率除以某个数字采样——它似乎总是 2 的幂，但我认为这不重要。

所以，如果我有 channel a、b 和 c，在 1、2 和 4 的分度处采样，我的流看起来像:

a0 b0 c0 a1 a2 b1 a3 a4 b2 c1 a5 ...

为了增加乐趣， channel 可以独立地是 float 或整数(虽然我知道每一个)，并且数据流不一定以 2 的幂结束:示例流在没有进一步扩展的情况下也是有效的。这些值有时很大，有时是小端，但我知道我要预先处理什么。

我有代码可以正确解压这些并用正确的值填充 numpy 数组，但速度很慢:它看起来像(希望我没有掩饰太多；只是给出算法的想法):

for sample_num in range(total_samples):
    channels_to_sample = [ch for ch in all_channels if ch.samples_for(sample_num)]
    format_str = ... # build format string from channels_to_sample
    data = struct.unpack( my_file.read( ... ) ) # read and unpack the data
    # iterate over data tuple and put values in channels_to_sample
    for val, ch in zip(data, channels_to_sample):
        ch.data[sample_num / ch.divider] = val

而且速度很慢——在我的笔记本电脑上读取一个 20MB 的文件需要几秒钟。 Profiler 告诉我我在 Channel#samples_for() 上花费了大量时间——这是有道理的；那里有一些条件逻辑。

我的大脑感觉好像有一种方法可以一举完成，而不是嵌套循环——也许使用索引技巧将我想要的字节读取到每个数组中？构建一个巨大的、疯狂的格式字符串的想法似乎也是一条值得商榷的道路。

更新

感谢那些回应的人。值得一提的是，numpy 索引技巧将读取我的测试数据所需的时间从大约 10 秒减少到大约 0.2 秒，速度提高了 50 倍。

最佳答案

真正提高性能的最佳方法是摆脱对所有样本的 Python 循环，让 NumPy 在编译的 C 代码中执行此循环。这实现起来有点棘手，但这是可能的。

首先，您需要做一些准备。正如 Justin Peel 所指出的，样本排列的模式在一些步骤后重复出现。如果 d_1, ..., d_k 是 k 个数据流的除数，b_1, ..., b_k 是流的样本大小(以字节为单位)，lcm 是这些除数的最小公倍数，则

N = lcm*sum(b_1/d_1+...+b_k/d_k)

将是流模式将在其后重复的字节数。如果您已弄清楚前 N 个字节中的每个字节属于哪个流，则可以简单地重复此模式。

您现在可以通过类似的方式为前 N 个字节构建流索引数组

stream_index = []
for sample_num in range(lcm):
    stream_index += [i for i, ch in enumerate(all_channels)
                     if ch.samples_for(sample_num)]
repeat_count = [b[i] for i in stream_index]
stream_index = numpy.array(stream_index).repeat(repeat_count)

这里，d 是序列 d_1, ..., d_k，b 是序列 b_1, ..., b_k。

现在你可以做

data = numpy.fromfile(my_file, dtype=numpy.uint8).reshape(-1, N)
streams = [data[:,stream_index == i].ravel() for i in range(k)]

您可能需要在末尾稍微填充数据以使 reshape() 工作。

现在，您在单独的 NumPy 数组中拥有属于每个流的所有字节。您可以通过简单地分配给每个流的 dtype 属性来重新解释数据。如果您希望第一个流被解释为大端整数，只需编写

streams[0].dtype = ">i"

这不会以任何方式改变数组中的数据，只是改变它的解释方式。

这可能看起来有点神秘，但在性能方面应该会好得多。

关于python - 读取交错数据的快速方法？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/4227990/

26

4

0

文章推荐： c++ - 如何在switch语句中使用成员变量？

文章推荐： c++ - LoadLibraryEx 忽略并排 list

文章推荐： Python 安装脚本扩展，如何包含 .h 文件？

快速/更改循环中变量的名称
如何更改循环中变量的名称？比如 number1 、 number2 、 number3 、 number4 ？ var array = [2,4,6,8] func ap ( number1: Int
iOS延迟更改背景颜色(快速)
我想设置 View 的背景颜色并在一定延迟后将其更改为另一种颜色。这是我的尝试方式: print("setting color 1") self.view.backgroundColor = UICo
快速 session 在请求之间不持久
我在使用 express-session 时遇到问题。 session 数据不会在请求之间持续存在。正如您在下面的代码中看到的那样，/join 路由设置了一些 session 属性，但是当 /sur
快速 Steam 叶环
我试图从叶渲染器获得一个非常简单的结果，用于快速 Steam 的 for 循环。我正在上传叶文件 HTML，因为它不接受此处格式正确的代码 - 下面的pizza.swift代码- import
performance - 快速、简单的程序员编辑器
你们中有人有什么好的链接可以与我分享吗？我正在寻找一个 FAST 程序员编辑器，它可以非常快速地打开包含超过 100, 000 行代码的文件？我目前正在使用记事本自动取款机，打开一个 29000 行长
r - 快速、高效地循环数百万行并匹配列
我现在正在处理眼动追踪数据，因此拥有一个巨大的数据集(想想数百万行)，因此希望有一种快速的方法来完成此任务。这是它的简化版本。数据告诉您眼睛在每个时间点正在查看的位置以及我们正在查看的每个文件。 X
ios - 选择提示音-快速
我是新手，想为计时器或其他设备选择提示音。如何打开此列表，以选择其中一种声音？ Alert sound list 最佳答案您将无法在应用中使用系统声音。但是，您可以包括自己的声音文件，并将其显示
arrays - 将顺序字符串构建到数组中(快速)
我编写了以下代码来构建具有顺序字符串的数组。它的工作方式与我预期的一样，但我希望它能更快地运行。有没有更有效的方法在PowerShell中产生我想要的结果？我是PowerShell的新手，非常感谢
r - 快速、简洁地生成唯一矩阵行的有序频率计数的方法
我有一个包含一些非唯一行的矩阵，例如: x 尝试 y <- rle(apply(x, 1, paste, collapse = " ")) # y$lengths is the vector con
ios - 键盘打开时移动菜单(快速)
我的函数“keyboardWillShown”有问题。所以我想要的是菜单打开时，菜单正好出现在键盘上方。它可以在Iphone 8 plus，8、7、6上完美运行。但是，当我在模拟器上运行Iphone
ios - 第二次API调用后应用崩溃(快速)
我正在尝试通过Swift 5中的HTTP get方法从API提取数据。它在启动时成功加载了数据，但是当我刷新页面时，它说“索引超出范围”，这是因为数据是不再会在我的日志中读取，因此索引中没有任何内容。
ios - 将时间戳转换为其他时区(快速)
我想做什么: 从我的数据库中获取时间戳并将其转换为用户的时区。我的代码: let tryItNow = "\(model.timestampName)" let format = D
ios - 查找字符串的宽度(快速)
给定字体名称和字体大小，如何查找字符串的宽度(CGFloat)？ (目标是将UIView的宽度设置为足以容纳字符串的宽度。) 我有两个字符串:一个重复“1”，重复36次，另一个重复“M”，重复36次。
ios - JSON解析(快速)
我正在尝试解析此JSON ["Items": ( { AccountBalance = 0; AlphabetType = 3; Description = "\U0631\U
ios - 根据自动布局更改UILabel中的字体大小(快速)
我在UINavigationBar内放置了一个UILabel。我想根据navigationBar的高度增加该标签的字体大小。当navigationBar很大时，我希望字体大小更大；当滚动并缩小nav
ios - 消除数字中的多个小数点(快速)
我想将用户输入限制为仅有效数字并使用以下内容: func textView(_ textView: UITextView, shouldChangeTextIn range: NSRange, rep
C# - 图像比较(快速)
目前我有一个包含超过 100.000 张图像的数据库，它们大小不一或类似，但我想为我的公司制作以下内容: 我插入/上传一张图片，系统返回最有可能相同的图片。我不知道使用什么算法，但它需要快速。我可以预
ios - 按下按钮时发生的操作 - 快速
在我的 swift 项目中，我有一个按钮，我想在标签上打印按下该按钮的时间。如何解决这个问题？最佳答案添加到DHEERAJ的答案中，您只需在func press(sender: UIButton
arrays - 我想从解析加载数组数据(快速)
我必须发表评论，尝试在解析中导入数组。然而，有一个问题。当我尝试从 Parse 加载数组时，我的输出是 ("Blah","Blah","Blah")这是一个元组...而不是一个数组 TT... 如何
swift - 简化嵌套 if 快速
我的应用程序有一个名为 MyDevice 的类，我用它来与硬件通信。该硬件是可选的，实例变量也是可选的: var theDevice:MyDevice = nil 然后，在应用程序中，我必须初始化设备

首页

博学

6Ren·AI

商城

python - 读取交错数据的快速方法？

更新