gpt4 book ai didi

hadoop - 更新 hadoop HDFS 文件

转载 作者:可可西里 更新时间:2023-11-01 14:19:24 28 4
gpt4 key购买 nike

我是 Hadoop 的新手。我一直在读到 HDFS 主要是关于“一次写入,随时读取”。我有一个用例,我可能必须对存储在 HDFS 中的文件进行修改。我一直在研究是否有任何方法可以做到这一点。

我的问题是是否可以将 HDFS 文件加载到 HBase 中,进行修改,然后将其保存回 HDFS,然后删除原始文件。如果可行,请告诉我。

最佳答案

如果您需要更新文件中的值,您最好使用 HBase。您仍然可以通过 TableInputFormat 和 TableOutputFormat 在 MR 作业中使用 HBase 表。如果您想追加数据,您可以使用任何支持 hdfs 追加的 hadoop 版本,例如 0.20.205.0。

关于hadoop - 更新 hadoop HDFS 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9104444/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com