30、保留已删除的HBase单元格-6ren

30、保留已删除的HBase单元格

转载作者：大佬之路更新时间：2024-01-07 13:06:54

26

4

保留已删除的单元格

默认情况下，删除标记会向后扩展到开始时间。因此，即使 Get 或 Scan 操作指示放置删除标记之前的时间范围，Get 或 Scan 操作也不会看到已删除的单元格（行或列）。

ColumnFamilies 可以选择保留已删除的单元格。在这种情况下，只要这些操作指定的时间范围在影响单元格的任何删除的时间戳之前结束，则仍然可以检索已删除的单元格。这允许甚至在存在删除的情况下进行时间点查询。

删除的单元格仍然受到TTL的限制，并且永远不会超过“最大数量的版本”删除的单元格。新的“原始”扫描选项将返回所有已删除的行和删除标记。

示例– 使用HBase Shell更改 KEEP_DELETED_CELLS 的值

hbase> hbase> alter ‘t1′, NAME => ‘f1′, KEEP_DELETED_CELLS => true

示例– 使用 API 更改 KEEP_DELETED_CELLS 的值

...
HColumnDescriptor.setKeepDeletedCells(true);
...

让我们来说明在 KEEP_DELETED_CELLS 表上设置属性的基本效果。

首先，没有：

create 'test', {NAME=>'e', VERSIONS=>2147483647}
put 'test', 'r1', 'e:c1', 'value', 10
put 'test', 'r1', 'e:c1', 'value', 12
put 'test', 'r1', 'e:c1', 'value', 14
delete 'test', 'r1', 'e:c1',  11

hbase(main):017:0> scan 'test', {RAW=>true, VERSIONS=>1000}
ROW                                              COLUMN+CELL
 r1                                              column=e:c1, timestamp=14, value=value
 r1                                              column=e:c1, timestamp=12, value=value
 r1                                              column=e:c1, timestamp=11, type=DeleteColumn
 r1                                              column=e:c1, timestamp=10, value=value
1 row(s) in 0.0120 seconds

hbase(main):018:0> flush 'test'
0 row(s) in 0.0350 seconds

hbase(main):019:0> scan 'test', {RAW=>true, VERSIONS=>1000}
ROW                                              COLUMN+CELL
 r1                                              column=e:c1, timestamp=14, value=value
 r1                                              column=e:c1, timestamp=12, value=value
 r1                                              column=e:c1, timestamp=11, type=DeleteColumn
1 row(s) in 0.0120 seconds

hbase(main):020:0> major_compact 'test'
0 row(s) in 0.0260 seconds

hbase(main):021:0> scan 'test', {RAW=>true, VERSIONS=>1000}
ROW                                              COLUMN+CELL
 r1                                              column=e:c1, timestamp=14, value=value
 r1                                              column=e:c1, timestamp=12, value=value
1 row(s) in 0.0120 seconds

注意删除单元格是如何放开的。

现在，让我们只用 KEEP_DELETED_CELLS 设置在表上运行相同的测试（您可以执行表或每列族）：

hbase(main):005:0> create 'test', {NAME=>'e', VERSIONS=>2147483647, KEEP_DELETED_CELLS => true}
0 row(s) in 0.2160 seconds

=> Hbase::Table - test
hbase(main):006:0> put 'test', 'r1', 'e:c1', 'value', 10
0 row(s) in 0.1070 seconds

hbase(main):007:0> put 'test', 'r1', 'e:c1', 'value', 12
0 row(s) in 0.0140 seconds

hbase(main):008:0> put 'test', 'r1', 'e:c1', 'value', 14
0 row(s) in 0.0160 seconds

hbase(main):009:0> delete 'test', 'r1', 'e:c1',  11
0 row(s) in 0.0290 seconds

hbase(main):010:0> scan 'test', {RAW=>true, VERSIONS=>1000}
ROW                                                                                          COLUMN+CELL
 r1                                                                                          column=e:c1, timestamp=14, value=value
 r1                                                                                          column=e:c1, timestamp=12, value=value
 r1                                                                                          column=e:c1, timestamp=11, type=DeleteColumn
 r1                                                                                          column=e:c1, timestamp=10, value=value
1 row(s) in 0.0550 seconds

hbase(main):011:0> flush 'test'
0 row(s) in 0.2780 seconds

hbase(main):012:0> scan 'test', {RAW=>true, VERSIONS=>1000}
ROW                                                                                          COLUMN+CELL
 r1                                                                                          column=e:c1, timestamp=14, value=value
 r1                                                                                          column=e:c1, timestamp=12, value=value
 r1                                                                                          column=e:c1, timestamp=11, type=DeleteColumn
 r1                                                                                          column=e:c1, timestamp=10, value=value
1 row(s) in 0.0620 seconds

hbase(main):013:0> major_compact 'test'
0 row(s) in 0.0530 seconds

hbase(main):014:0> scan 'test', {RAW=>true, VERSIONS=>1000}
ROW                                                                                          COLUMN+CELL
 r1                                                                                          column=e:c1, timestamp=14, value=value
 r1                                                                                          column=e:c1, timestamp=12, value=value
 r1                                                                                          column=e:c1, timestamp=11, type=DeleteColumn
 r1                                                                                          column=e:c1, timestamp=10, value=value
1 row(s) in 0.0650 seconds

KEEP_DELETED_CELLS 是为了避免从 HBase 中删除单元格时，删除它们的唯一原因是删除标记。因此，如果您编写的版本多于配置的最大版本，或者您有TTL且单元格超过配置的超时等，则 KEEP_DELETED_CELLS 启用的已删除单元格将被删除。

26

4

0

文章推荐： 32、HBase限制因素

文章推荐： 31、HBase二级索引和备用查询路径

文章推荐： 03、HBase 配置文件

文章推荐： 29、HBase生存时间（TTL）

ruby - 如何要求正确版本的测试/单元
我试图要求 test/unit 的新版本(即不是与 ruby 捆绑的版本) .根据 instructions我用 gem i test-unit 安装它.但是现在当我需要 test/unit我似乎
Systemd 单元，使用外部脚本检查状态
简短版本是: 我有一个 systemd 单元，我想在调用时检查脚本的返回代码: systemctl status service.service 长版本:我有一个 lsb init 脚本正是这样做的，
c# - 单元/集成测试中的反射问题
我正在使用反射动态创建一个类的实例，这工作正常，除非尝试通过单元测试执行此操作 - 我使用的是 MS 测试框架。我收到熟悉的错误:“无法加载文件或程序集‘Assy’或其依赖项之一。系统找不到指定的文
javascript - (单元)测试网站界面的方法
我想知道测试网站“界面功能”的最佳实践是什么。我对哪些方法可用于测试界面和动态生成的内容感兴趣。特别是，我很难弄清楚是否可以为需要用户交互的操作创建自动化测试，或者这是否只是浪费时间，我应该让一些
python - (单元)测试python信号处理程序
我有一个简单的 Python 服务，其中有一个无限执行某些操作的循环。在各种信号上，sys.exit(0) 被调用，这导致 SystemExit 被引发，然后如果可以的话应该进行一些清理。在测试中，
c# - HoughLinesP参数!单元？
我正在使用 OpenCV 2.4.2 这是 OpenCV 文档中的引文 C++: void HoughLinesP(InputArray image, OutputArray lines, doubl
c# - 单元/集成测试和恢复数据库
忙于 C# 中的自动化测试用例，我们需要在每次测试后恢复数据库快照。问题是，当运行多个测试时它会失败，因为“其他用户正在使用数据库时无法更改数据库状态。” 我们使用 SqlConnection.Cle
C# 单元(文件范围)命名空间
我阅读了 C# 规范并用谷歌搜索了它，但一无所获。我 99% 肯定 C# 中没有像单元命名空间指令这样的功能，但问题是:为什么？是否有惯用或技术原因？这很方便，尤其是当我们的大部分文件都由单个命名
ios - iOS 单元/应用程序测试目标如何与其宿主应用程序中的类进行链接？
我目前正在尝试向我的应用程序(一个非常老的项目......评论说 iOS 2.0)添加单元测试(精确的应用程序测试)并且总是偶然发现 undefined symbols for architectur
delphi - 如何向项目添加新的(自制)单元
我正在使用Delphi 7，并且有一个新单元要在我的项目中使用。我已经编译了新的。当我尝试通过将其添加到uses子句在项目中使用此单元时，出现错误，提示未找到.dcu文件。我还尝试将文件的完整路径放在
unit-testing - 单元/集成测试nHibenrate查询
场景：我需要编写一个复杂的nHibernate查询，该查询将返回预计的DTO，但是我想使用TDD方法。该方法如下所示： public PrintDTO GetUsersForPrinting(int
slideshow - 以幻灯片模式运行 Jupyter 单元
您可以通过运行以下命令在事件 html 设置中显示 Jupyter 笔记本: $ jupyter nbconvert untitled.ipynb --to slides --post serve 有
adsense - 如何在一个页面上使用多个 AdSense 单元？
如何在一个网站上拥有多个 AdSense 单元？ Google 提供的唯一代码是按单位计算的。 (adsbygoogle = window.adsbygoogle || []).push({})
unit-testing - 单元/集成测试中文件系统依赖关系的最佳实践
我刚刚开始为大量代码编写测试。有很多类依赖于文件系统，即读取 CSV 文件、读/写配置文件等。当前测试文件存储在项目(这是一个 Maven2 项目)的 test 目录中，但由于多种原因该目录并不总是
unit-testing - (单元)测试驱动开发
我对 TDD 还很陌生，在单元测试方面也不是很老练，所以才有这个问题。我有这个用 PHP 编写的遗留函数 function foo(){ x = bar(); y = baz();
java - 垂直排列 JCheckBox 单元
我创建了一个程序，在 Swing 窗口的一侧显示结果过滤选项，但默认情况下它们水平相邻显示，这浪费了我在 BorderLayout 的西侧分配的空间。我可以在构造函数或添加语句中传递任何内容来将它们堆
c# - 如何(单元)测试弱引用列表的内存管理功能？
标题不好的借口:如果有人能更好地描述它，请做。我有一个 WeakList类，它“基本上”是一个 List> (虽然不是字面意义上的派生自列表，但它应该对用户完全透明)。现在的基本思想是“如果引用的
ios - 如何继续添加多个原型(prototype)单元
我正在尝试在 UITableView 上添加两个原型(prototype)单元。但是，我不知道如何验证是否能够为每个原型(prototype)“返回”正确的单元格。你们能帮我一下吗？ func ta
swift - 如何重新加载经过编辑的更改的 CloudKit 单元
我正在使用 CloudKit 作为数据库创建一个简单的待办事项列表应用程序。目前我可以添加和删除对象，但对编辑对象感到困惑。编辑项目 Controller protocol EditItemCont
python - 涉及序列的任务需要多少个 RNN 单元？
我正在针对以下任务训练 RNN:给定一个包含 30 个单词的序列，然后将该序列分类为二进制类。在我的网络中拥有超过 30 个单元(LSTM、GRU 或普通 RNN)有好处吗？我在网上看到过很多例子，

首页

博学

6Ren·AI

商城

30、保留已删除的HBase单元格

保留已删除的单元格