- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我有一些大的(200 GB 是正常的)平面数据文件,我想将它们存储在某种数据库中,以便可以快速访问并以数据逻辑组织的直观方式进行访问。将其视为大量非常长的录音,其中每个录音的长度(样本)相同,并且可以被认为是一行。其中一个文件通常包含大约 100,000 个录音,每个录音的长度为 2,000,000 个样本。
将这些记录作为 BLOB 数据行存储在关系数据库中会很容易,但在很多情况下,我只想将整个数据集的某些列加载到内存中(例如,样本 1,000-2,000) .执行此操作最节省内存和时间的方法是什么?
请不要犹豫,询问您是否需要对我的数据的详细信息进行更多说明以便提出建议。
编辑:澄清数据维度...一个文件包括:100,000 行(记录)乘以 2,000,000 列(样本)。我研究过的大多数关系数据库都允许在一个表中最多有几百到几千行。再一次,我对面向对象的数据库了解不多,所以我想知道这样的事情是否对这里有帮助。当然,任何好的解决方案都是非常受欢迎的。谢谢。
编辑:澄清数据的用途...数据只能由我将编写的自定义桌面/分布式服务器应用程序访问。每个数据“集”(到目前为止我称之为 200 GB 的文件)都有元数据(收集日期、过滤器、采样率、所有者等)。还有与每个录音相关的元数据(我希望它是表格中的一行,这样我就可以为每个录音元数据添加列)。所有元数据都是一致的。 IE。如果一段特定的元数据存在于一个记录中,那么它也存在于该文件中的所有记录中。示例本身没有元数据。每个样本都是 8 位的 plain-ol' 二进制数据。
最佳答案
数据库存储可能不适合大文件。是的,这是可以做到的。是的,它可以工作。但是数据库备份呢?文件内容可能不会经常更改 - 添加后,它们将保持不变。
我的建议是将文件存储在磁盘上,但创建一个基于数据库的索引。当文件夹/目录/等中的文件超过 10k 时,大多数文件系统都会变得胡思乱想或变慢。您的应用程序可以生成文件名并将元数据存储在数据库中,然后按生成的名称在磁盘上进行组织。缺点是文件内容可能无法从名称中直接看出。但是,您可以轻松备份更改的文件,而无需专门的数据库备份插件和复杂的分区、增量备份方案。此外,在文件内查找操作变得更加简单(向前跳转、倒带等)。在文件系统中通常比在数据库中更好地支持这些操作。
关于sql - 数据库或其他存储和动态访问 HUGE 二进制对象的方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8670276/
我的一位教授给了我们一些考试练习题,其中一个问题类似于下面(伪代码): a.setColor(blue); b.setColor(red); a = b; b.setColor(purple); b
我似乎经常使用这个测试 if( object && object !== "null" && object !== "undefined" ){ doSomething(); } 在对象上,我
C# Object/object 是值类型还是引用类型? 我检查过它们可以保留引用,但是这个引用不能用于更改对象。 using System; class MyClass { public s
我在通过 AJAX 发送 json 时遇到问题。 var data = [{"name": "Will", "surname": "Smith", "age": "40"},{"name": "Wil
当我尝试访问我的 View 中的对象 {{result}} 时(我从 Express js 服务器发送该对象),它只显示 [object][object]有谁知道如何获取 JSON 格式的值吗? 这是
我有不同类型的数据(可能是字符串、整数......)。这是一个简单的例子: public static void main(String[] args) { before("one"); }
嗨,我是 json 和 javascript 的新手。 我在这个网站找到了使用json数据作为表格的方法。 我很好奇为什么当我尝试使用 json 数据作为表时,我得到 [Object,Object]
已关闭。此问题需要 debugging details 。目前不接受答案。 编辑问题以包含 desired behavior, a specific problem or error, and the
我听别人说 null == object 比 object == null check 例如: void m1(Object obj ) { if(null == obj) // Is thi
Match 对象 提供了对正则表达式匹配的只读属性的访问。 说明 Match 对象只能通过 RegExp 对象的 Execute 方法来创建,该方法实际上返回了 Match 对象的集合。所有的
Class 对象 使用 Class 语句创建的对象。提供了对类的各种事件的访问。 说明 不允许显式地将一个变量声明为 Class 类型。在 VBScript 的上下文中,“类对象”一词指的是用
Folder 对象 提供对文件夹所有属性的访问。 说明 以下代码举例说明如何获得 Folder 对象并查看它的属性: Function ShowDateCreated(f
File 对象 提供对文件的所有属性的访问。 说明 以下代码举例说明如何获得一个 File 对象并查看它的属性: Function ShowDateCreated(fil
Drive 对象 提供对磁盘驱动器或网络共享的属性的访问。 说明 以下代码举例说明如何使用 Drive 对象访问驱动器的属性: Function ShowFreeSpac
FileSystemObject 对象 提供对计算机文件系统的访问。 说明 以下代码举例说明如何使用 FileSystemObject 对象返回一个 TextStream 对象,此对象可以被读
我是 javascript OOP 的新手,我认为这是一个相对基本的问题,但我无法通过搜索网络找到任何帮助。我是否遗漏了什么,或者我只是以错误的方式解决了这个问题? 这是我的示例代码: functio
我可以很容易地创造出很多不同的对象。例如像这样: var myObject = { myFunction: function () { return ""; } };
function Person(fname, lname) { this.fname = fname, this.lname = lname, this.getName = function()
任何人都可以向我解释为什么下面的代码给出 (object, Object) 吗? (console.log(dope) 给出了它应该的内容,但在 JSON.stringify 和 JSON.parse
我正在尝试完成散点图 exercise来自免费代码营。然而,我现在只自己学习了 d3 几个小时,在遵循 lynda.com 的教程后,我一直在尝试确定如何在工具提示中显示特定数据。 This code
我是一名优秀的程序员,十分优秀!