gpt4 book ai didi

hadoop - HBase hive 集成

转载 作者:可可西里 更新时间:2023-11-01 16:56:16 26 4
gpt4 key购买 nike

我通过提及默认版本 5 创建了一个 HBase

创建'表名',{NAME => 'cf', VERSIONS => 5}并插入两行(row1 和 row2)

put 'tablename','row1','cf:id','row1id'
put 'tablename','row1','cf:name','row1name'
put 'tablename','row2','cf:id','row2id'
put 'tablename','row2','cf:name','row2name'
put 'tablename','row2','cf:name','row2nameupdate'
put 'tablename','row2','cf:name','row2nameupdateagain'

尝试使用扫描选择数据,我得到了最新的更新数据。当我尝试使用以下命令选择不同的版本数据时,我得到了不同的版本数据。

scan 'tablename',{RAW => true, VERSIONS => 5}

现在创建了一个Hive External表指向这个HBase表

CREATE EXTERNAL TABLE hive_timestampupdate(key int, value string)
STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
WITH SERDEPROPERTIES ("hbase.columns.mapping" = ":key,cf:name")
TBLPROPERTIES ("hbase.table.name" = "tablename");

select * from hive_timestampupdate

当我查询表 hive_timestampupdate 时,我能够看到数据。

默认情况下,我会根据时间戳获取最新的更新数据。这里也想查询不同版本的数据。

将获取 HBase 的不同版本数据的 Hive 命令。

请帮忙。

提前致谢。

最佳答案

来自https://cwiki.apache.org/confluence/display/Hive/HBaseIntegration

there is currently no way to access the HBase timestamp attribute, and queries always access data with the latest timestamp.

关于hadoop - HBase hive 集成,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29559615/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com