gpt4 book ai didi

database - 稀疏数据/数据存储/数据库是什么意思?

转载 作者:可可西里 更新时间:2023-11-01 14:09:22 27 4
gpt4 key购买 nike

最近一直在阅读 Hadoop 和 HBase,并遇到了这个术语-

HBase is an open-source, distributed, sparse, column-oriented store...

稀疏是什么意思?它与sparse matrix有关吗? ?我猜这是它可以有效存储的数据类型的一个属性,因此想了解更多。

最佳答案

在常规数据库中,行是稀疏的,但列不是。创建行时,会为每一列分配存储,而不管该字段是否存在值(字段是为行和列的交集分配的存储)。

这允许固定长度的行大大改善读取和写入时间。可变长度数据类型使用指针的模拟来处理。

稀疏列会导致性能下降并且不太可能为您节省很多磁盘空间,因为指示 NULL 所需的空间小于链表样式的链式指针体系结构所需的 64 位指针通常用于实现非常大型非连续存储。

存储很便宜。性能不是。

关于database - 稀疏数据/数据存储/数据库是什么意思?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6587007/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com