Cassandra 3.11 SSTableLoader 机制-6ren

Cassandra 3.11 SSTableLoader 机制

转载作者：行者123 更新时间：2023-12-02 11:30:32

27

4

我一直在使用 SSTableLoader 实用程序在两个不同的 Cassandra 集群之间批量传输数据，我想知道是否有其他人遇到了相同的问题。源集群有数据，目标集群没有数据。

我已经阅读了 datastax 页面上有关该实用程序的详细信息，但关于它的工作原理，我仍然有一些未解答的问题。

我在源集群的事件节点上使用该实用程序，命令遵循以下格式:

sstableloader -d target.host.ip -v -f /etc/cassandra/cassandra.yaml /cassandra/data/keyspace1/table1-uuid

这两个集群均设置有 256 个虚拟节点，每个集群中有 6 个节点。两种环境中的架构均为 RF = 3，并且表的结构均相同。

所以我的问题如下:

1) 该实用程序从您指定的 cassandra.yaml 中提取源集群信息，但您仍然必须指定 SSTable 的绝对路径。那么，从单个节点运行 SSTableLoader 完成后是否会在目标位置提供整个表？由于目标集群上的 token 范围不同，因此似乎很难验证。

2)datastax 信息显示:

To get the best throughput from SSTable loading, you can use multiple instances of sstableloader to stream across multiple machines. No hard limit exists on the number of SSTables that sstableloader can run at the same time, so you can add additional loaders until you see no further improvement.

这是否意味着对于单个表，我将跨多个源计算机启动 SSTableLoader 的多个实例？或者这只是意味着我可以同时将 SSTableLoader 用于多台机器上的多个不同表。我试图了解他们提到的吞吐量增益是针对单个表还是仅针对正在运行的多个表。

3) 需要进行哪些语法修改才能从快照运行？我拍摄了一个快照并通过运行相同的命令进行测试，但进一步进入表的快照目录，它没有正确解析，它说“快照”是无效的键空间。

无论如何，谢谢希望我的问题足够清楚。

最佳答案

1) 如果您的 RF=3 并且您的集群有 3 个节点，则每个节点都保存全部数据。由于更新尚未传播到所有副本，因此可能仍然存在一些细微的变化。如果集群中的节点数量大于 RF(您的情况是 6 个节点，RF=3)，则每个节点保存 50% 的数据组合(不同的 token 范围)。无论如何，您需要在从每个源节点到新集群的目标节点的所有键空间 + 表上运行 sstableloader(假设比例为 1:1)。

2) 是的，您可以在同一个表/键空间上从每个源节点并行运行多个 sstableloader 到其匹配的目标节点。但这也意味着您可以对不同的键空间/表执行此操作，只要最终从所有键空间/表的所有源节点到其匹配的目标节点执行该操作(假设比例为 1:1)。

3) 从备份(快照)恢复是一个不同的过程，不涉及使用sstableloader。您可以阅读更多相关信息here .

还有一个选项可以使用nodetoolfresh将sstables从所有源节点加载到新的目标节点，但仅应在num_nodes=RF时使用。了解更多相关信息here

关于Cassandra 3.11 SSTableLoader 机制，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/52752022/

27

4

0

文章推荐： Pandas 数据框使用特定于行的 N 查找每行的最大 N 个元素

文章推荐： windows-7 - 在 Windows 7 上使用 XAMPP 设置 phpstorm 4

文章推荐： vb.net - 通用列表复制引用而不是创建复制列表

文章推荐： Liquibase 校验和验证失败

详解Numpy中的广播原则/机制
广播的原则如果两个数组的后缘维度(从末尾开始算起的维度)的轴长度相符或其中一方的长度为1，则认为它们是广播兼容的。广播会在缺失维度和(或)轴长度为1的维度上进行。在上面的对arr每一列减去列
MySQL 学习笔记（二）MVCC 机制
之前在讲 MySQL 事务隔离性提到过，对于写操作给读操作的影响这种情形下发生的脏读、不可重复读、虚读问题。是通过MVCC 机制来进行解决的，那么MVCC到底是如何实现的，其内部原理是怎样的呢？我们要
用于保留用户操作值的 JavaScript 机制
我创建了一个 JavaScript 对象来保存用户在 ColorBox 中检查复选框时设置的值。 . 我对 jQuery 和“以正确的方式”编程 JavaScript 比较陌生，希望确保以下用于捕获用
python - 在循环引用下理解python的import *机制
我为了回答aquestion posted here on SO而玩示例，发现很难理解python的import *破坏作用域的机制。首先是一点上下文：这个问题不涉及实际问题；我很清楚from fo
c# - 伪静态虚拟C#机制
我想让我的类具有标识此类的参数 ID。例如我想要这样的东西: class Car { public static virtual string ID{get{return "car";}} }
Java throttle 机制
更新:我使用的是 Java 1.6.34，没有机会升级到 Java 7。我有一个场景，我每分钟只能调用一个方法 80 次。它实际上是由第 3 方编写的服务 API，如果您多次调用它，它会“关闭”(忽
自动滚动到不断增长的页面底部的 Javascript 机制？
希望这对于那些使用 Javascript 的人来说是一个简单的答案...... 我有一个日志文件，该文件正在被一个脚本监视，该脚本将注销中的新行提供给任何连接的浏览器。一些人评论说，他们希望看到的更多
抑制严格标准消息的 PHP 机制
我们正在开发针对 5.2 开发的 PHP 应用程序，但我们最近迁移到了 PHP 5.3。我们没有时间去解决所有迁移到 PHP 5.3 的问题。具体来说，我们有很多消息: Declaration of
深入理解Java定时调度(Timer)机制
简介在实现定时调度功能的时候，我们往往会借助于第三方类库来完成，比如： quartz 、 spring schedule 等等。jdk从1.3版本开始，就提供了基于 timer 的定时调度功能。
Java序列化(Serialization) 机制
Java中，一切都是对象，在分布式环境中经常需要将Object从这一端网络或设备传递到另一端。这就需要有一种可以在两端传输数据的协议。Java序列化机制就是为了解决这个问题而
iphone - 如何实现自定义控制的目标 Action 机制？
我将编写自己的自定义控件，它与 UIButton 有很大不同。由于差异太大，我决定从头开始编写。所以我所有的子类都是 UIControl。当我的控件在内部被触摸时，我想以目标操作的方式触发一条消息。
delphi - 我如何知道使用了哪种 SASL 机制？
在我的代码中，在创建 TIdIMAP4 连接之前，我设置了一大堆 SASL 机制，希望按照规定的“最好到最差”顺序，如下所示: IMAP.SASLMechanisms.Add.SASL := mIdS
Kubernetes kube-proxy 机制
在 Kubernetes 中，假设我们有 3 个 pod，它们物理上托管在节点 X、Y 和 Z 上。当我使用“kubectl expose”将它们公开为服务时，它们都是集群中的节点(除了 X、Y 和
java - 游戏 build 。机制
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 9 年前。 Improve this ques
sockets - 我应该在哪个时刻使用哪种进程间通信(ipc)机制？
我知道进程间通信 (ipc) 有几种方法，例如: 文件信号 socket 消息队列管道命名管道信号量共享内存消息传递内存映射文件但是我无法找到将这些机制相互比较并指出它们在不同环境中的
java - 机制 TD2 不支持单点登录
当我尝试连接到 teradata 时，出现了TD2 机制不支持单点登录错误。在 C# 中，我遇到了类似的问题，我通过添加 connectionStringBuilder.Authetication
javascript - 绝对最简单的服务器端 Javascript 机制？
我有一个带有 JSON API 的简单 Javascript 应用程序。目前它在客户端运行，但我想将它从客户端移动到服务器。我习惯于学习新平台，但在这种情况下，我的时间非常有限 - 所以我需要找到绝对
javascript - 浏览器中的事件绑定(bind)机制
我想了解事件绑定(bind)/解除绑定(bind)在浏览器中是如何工作的。具体来说，如果我删除一个已经绑定(bind)了事件的元素，例如使用 jQuery:$("#anElement").remove
java - 假装同步的异步 websocket 机制
我不是在寻找具体答案，只是一个想法或提示。我有以下问题: Android 应用程序是 Web 服务的客户端。它有一个线程，通过 http 协议(protocol)发送事件(带有请求 ID 的 XML
linux - FreeBSD syncookies 机制
我正在研究 FreeBSD TCP/IP 栈。似乎有 2 种 syn flood 机制，syncookies 和 syncache。我的问题是关于 syncookies，它是从头开始还是在 SYN 队

首页

博学

6Ren·AI

商城

Cassandra 3.11 SSTableLoader 机制