gpt4 book ai didi

hadoop - HBase:获取带有时间戳的行数据请求

转载 作者:可可西里 更新时间:2023-11-01 16:44:16 24 4
gpt4 key购买 nike

我通过 Java API 创建了一个 HBase 表,并通过 Put 添加了数据。我还可以使用相应的 Get 读取 Java 中的数据。 HBase 文档说单元格值也可以通过使用 GET 请求读取,例如在浏览器中,请参阅 documentation .

以下请求对我有用,它返回整行:

http://my_hbase_url:12345/dm-table/exampleRow/family:html?v=1

结果是一个 xml,如下所示:

<CellSet>
<Row key="ZXhhbXBsZVJvdw==">
<Cell column="ZmFtaWx5Omh0bWw=" timestamp="1466667016879">PGh0bWw+Li4uTXkgSFRNTC4uLjwvaHRtbD4=</Cell>
</Row>
</CellSet>

如果您查看时间戳,它是1466667016879,但是当我调用

http://my_hbase_url:12345/dm-table/exampleRow/family:html/1466667016879

我得到一个 not found 结果! Java 代码也可以工作并给了我这个时间戳:

HTable table = new HTable(config, TABLE_NAME.getBytes());

Get g = new Get("exampleRow".getBytes());
g.setTimeStamp(1466667016879L);

Result r = table.get(g);
System.out.println("Timestamp: " + r.rawCells()[0].getTimestamp());

byte[] value = r.getValue(CF_DEFAULT.getBytes(), "html".getBytes());
String valueStr = new String(value);
System.out.println("GET: " + valueStr);

这打印:

Timestamp: 1466667016879
GET: <html>...My HTML...</html>

所以时间戳确实存在,但是 http GET 请求不能使用时间戳,有人可以帮忙吗?

最佳答案

URL 中的时间戳查找具有 EARLIER 时间戳的最新数据集!

看看下面的例子:

当您调用时http://my_hbase_url:12345/dm-table/exampleRow/family:html你得到以下结果:

<CellSet>
<Row key="ZXhhbXBsZVJvdw==">
<Cell column="ZmFtaWx5Omh0bWw=" timestamp="1466667016879">PGh0bWw+Li4uTXkgSFRNTC4uLjwvaHRtbD4=</Cell>
</Row>
</CellSet>

因此,如果您想通过时间戳获取此结果(例如,因为您保存了不同版本的数据),您可以将时间戳添加到 URL 以获取具有较早时间戳的最新数据集。因此,要获得上面显示的数据集,您必须添加 /<timestamp + 1>到网址:

http://my_hbase_url:12345/dm-table/exampleRow/family:html/1466667016880

这会带来与上图相同的结果。如果这是唯一或最早的版本,请调用 http://my_hbase_url:12345/dm-table/exampleRow/family:html/1466667016879不会找到任何结果并以 not found 结尾结果,如上述问题所述。

但是,你必须使用<timestamp + 1> (或更高)以获得预期的数据!

感谢@Whitefret 提供的解决提示!

关于hadoop - HBase:获取带有时间戳的行数据请求,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37985426/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com