gpt4 book ai didi

logging - hdf5是否适合实时测量

转载 作者:行者123 更新时间:2023-12-04 12:48:47 25 4
gpt4 key购买 nike

我想知道hdf5是否适合实时数据记录?

更确切地说:
我在一个项目中工作,我们希望连续(采样率从 30 到 400Hz)混合大量不同性质的数据(几个小时)(遥测、信号、视频)。

数据必须实时(或稍有延迟)写入,以防止我们在潜在的崩溃中丢失它们。

我们的第一个原型(prototype)是基于sqlite3的,但是我们觉得长期使用可能会出现一些限制:速度,一个数据库==一个文件,以及从多个线程访问数据库的困难(同时读取和写入时锁定异常) )。

因此,我正在考虑将 hdf5 用作磁盘上数据存储的后端(以及用于内部表示的 numpy/pytable)的可能性。你认为可以从这种 python 绑定(bind)中定期更新 hdf5 文件吗?

最佳答案

HDF5 数据包表适用于实时测量 - 但是您最好使用固定大小的数据包到常规的旧 posix 文件并稍后转换。这是因为 HDF5 目前不是很健壮,并且不提供使用低级文件 IO 代码所具有的各种保证 - 说低级代码实际上很容易使用。在某些时候,当您使用的数据足够复杂时,应该使用 HDF5,但要注意相对于低级文件 IO,它是重量级的,并且由于其全局互斥锁的使用,不能以合理的确定性/性能进行多线程处理。此外,例如,如果系统崩溃,生成的 HDF5 文件是垃圾/不可恢复的 - 这将在一天之内得到解决,但需要 HDF 小组的资金来加快并在 future 十年内完成它。

我自己的策略是尽可能使用数据包日志文件。然后在这些文件被记录后立即将结果转换为 HDF5 以供长期使用 + 压缩 + 由其他工具/程序使用。所说的记录器通常我会在编写时转储一个解释二进制结构的 HDF5 文件,以便稍后我可以简单地读取该文件以了解数据包日志文件中的结构,并在加载数据包后将其交给真正的 HDF 文件在内存中。

说了这么多,看看the packet table api from boeing .它在 hdf5 附带的 hl c++ 库中也有一个害群之马 c++ 绑定(bind),尽管我必须为我的使用对其进行修补。

关于logging - hdf5是否适合实时测量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11469417/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com