gpt4 book ai didi

hadoop - 如何使用 starttime endtime 导出 hbase 表?

转载 作者:可可西里 更新时间:2023-11-01 14:50:23 24 4
gpt4 key购买 nike

我正在尝试执行增量备份,我已经检查了导出选项但无法确定开始时间选项。另外请在 CopyTable 上提出建议,我该如何恢复。

最佳答案

使用 CopyTable您刚刚在 the same or another cluster 上收到给定表格的副本(实际上是 CopyTable MapReduce 作业)。没有奇迹。

如何恢复由您自己决定。明显的选择是:

  • 使用相同的工具将表格复制回来。
  • 只需获取/放置选定的行(我认为您在这里需要)。请注意,在回传数据时应保留时间戳。

实际上,对于增量备份,您只需编写扫描表并将具有给定时间戳的行获取/放入具有按日期计算的名称的表的作业就足够了。恢复应该以相反的方向工作 - 读取具有计算名称的表并将其记录放入相同的时间戳。

我还向您推荐以下技术:table snapshot (CDH 4.2.1 使用 HBase 0.94.2)。它看起来不适用于增量备份,但也许您会在这里找到一些有用的东西,比如附加 API。现在从备份的角度来看,它看起来不错。

希望这会有所帮助。

关于hadoop - 如何使用 starttime endtime 导出 hbase 表?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16649940/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com