gpt4 book ai didi

hadoop - 如何将 HBase 表以 Parquet 格式移动到 HDFS?

转载 作者:可可西里 更新时间:2023-11-01 14:33:05 26 4
gpt4 key购买 nike

我必须构建一个工具,以 parquet 格式处理从 HBase(HFiles) 到 HDFS 的数据存储。

请建议将数据从 HBase 表移动到 Parquet 表的最佳方法之一。

我们必须将 4 亿条记录从 HBase 迁移到 Parquet。如何实现这一目标以及移动数据的最快方式是什么?

提前致谢。

问候,

帕迪普夏尔马。

最佳答案

请查看此项目tmalaska/HBase-ToHDFS它读取 HBase 表并将其写为 Text、Seq、Avro 或 Parquet

Parquet 的用法示例:

Exports the data to Parquet

hadoop jar HBaseToHDFS.jar ExportHBaseTableToParquet exportTest c export.parquet false avro.schema

关于hadoop - 如何将 HBase 表以 Parquet 格式移动到 HDFS?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37023758/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com