gpt4 book ai didi

hadoop - 如果我们使用Hadoop处理大数据,数据将存储在哪里,因为hadoop数据库HBase存储结构化数据,而大数据是非结构化

转载 作者:行者123 更新时间:2023-12-02 20:32:03 27 4
gpt4 key购买 nike

Hadoop用于处理大数据,hadoop使用HBase作为其数据库,但是BigData可能有80%是非结构化的,而HBase仅存储结构化数据。

非结构化数据将存储在哪里?还是有hadoop的任何工具将非结构化数据转换为结构化格式?

最佳答案

“大数据”并不意味着存在任何结构,但是大多数数据集都是半结构化的,否则将很难一致地进行解析。

HBase位于HDFS之上。而且Hbase可以存储二进制blob,因此其数据可用于存储非结构化数据。

HDFS可以存储任何类型的数据。它没有有关文件内容的元数据

通常,您使用Hive(MetaStore)来应用HDFS数据集的结构

关于hadoop - 如果我们使用Hadoop处理大数据,数据将存储在哪里,因为hadoop数据库HBase存储结构化数据,而大数据是非结构化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52904354/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com