gpt4 book ai didi

cassandra - 为大型数据集删除 cassandra 中的列

转载 作者:行者123 更新时间:2023-12-02 00:59:30 24 4
gpt4 key购买 nike

我们有一个多余的列,我们想从我们的 Cassandra 数据库(版本 2.1.15)中删除它。这是一个文本列,表示磁盘上的大部分数据(15 个节点 X 每个节点 1.8 TB)。

最简单的选择似乎是删除该列的更改表,然后让 Cassandra 压缩处理事情(也运行 Cassandra Reaper 来管理修复)。然而,考虑到我担心的数据集的大小,我会通过大量删除来破坏集群。

我考虑过的其他选项是通过键空间将值设置为空的过程,但我认为这与删除列具有相同的效果,但更不受控制(但也需要编写一些东西来做到这一点)。

有人会对如何解决这个问题有任何建议吗?

谢谢!

最佳答案

删除列确实将删除的值标记为墓碑。列值立即变得不可用,并且在下一个压缩周期中删除列数据。

如果你想在压实发生之前加快列的移除,你可以运行 nodetool upgradesstables 删除数据,使用后 更改表 命令更改列的元数据。

参见文档: https://docs.datastax.com/en/cql/3.1/cql/cql_reference/alter_table_r.html

关于cassandra - 为大型数据集删除 cassandra 中的列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51555961/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com