gpt4 book ai didi

hadoop - 如果具有相同的值,则停止 Hbase 更新操作

转载 作者:可可西里 更新时间:2023-11-01 15:49:23 26 4
gpt4 key购买 nike

我在 Hbase 中有一个名为 'xyz' 的表。当我对该表执行更新操作时,它会更新一个表,即使它是相同的记录。

如何控制不添加第二条记录

例如:

create 'ns:xyz',{NAME=>'cf1',VERSIONS => 5}

put 'ns:xyz','1','cf1:name','NewYork'

put 'ns:xyz','1','cf1:name','NewYork'

如果我检查所有版本,上面的 put 语句会给出 2 条具有不同时间戳的记录。我期望它不应该添加第二条记录,因为它具有相同的值

最佳答案

HBase 不会查看整行并确定它是否与您要添加的数据相同。这将是一项昂贵的操作,而 HBase 以其快速的插入速度而自豪。

如果您真的很想这样做(我会问您是否真的想这样做),您应该先执行 GET 以查看数据是否已存在于表中。

您也可以在每次 PUT 数据时编写一个协处理器来执行此操作,但同样性能不理想。

关于hadoop - 如果具有相同的值,则停止 Hbase 更新操作,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51857189/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com