gpt4 book ai didi

Hadoop 初学者 - 数据摄取和分析

转载 作者:可可西里 更新时间:2023-11-01 15:52:15 26 4
gpt4 key购买 nike

HDFS 存储结构化和非结构化数据。HIVE 和 IMPALA 使我们能够编写 sql 查询,然后将其转换为 MapReduce。用户如何了解存储数据的模式或如何根据存储在 HDFS 中的数据形成这些表?

最佳答案

如果您使用 Parquet 文件格式,可以使用工具直接检查文件 block 。参见 this例如。大多数 hadoop 文件格式也有类似的方便工具,例如 https://orc.apache.org/docs/tools.html对于兽人文件。

关于Hadoop 初学者 - 数据摄取和分析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47865229/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com