cassandra - 理解 Cassandra 背后的哲学-6ren

cassandra - 理解 Cassandra 背后的哲学

转载作者：行者123 更新时间：2023-12-05 05:26:05

24

4

我正在尝试熟悉 Apache Cassandra，以完成特定的 PoC 工作。在浏览了网上的各种文章，尝试了各种可用的库/客户端之后，我的脑海中突然出现了一个特定的问题。

我们想到 Cassandra 的最初原因是因为我们想要一个“真正的”分布式数据存储。根据我对“分布”的理解，它最终归结为某种“键值”和某种“一致性哈希”，如果我能够以 super 简洁的方式表达自己的话!

因此，像 Cassandra 这样的键值存储非常适合。然而，当我试图深入研究文章以了解 Cassandra 中的数据建模时，几乎所有文章都使用 CQL 进行解释/举例说明。此外，官方声明似乎是 CQL 应该是学习 Cassandra 的“合法”方式。为什么要大力插入与 SQL 保持一致？

我不需要关系模型，这就是我来Cassandra的原因。我欣赏它的基本概念，如分区键/集群列等，我想了解它是如何在 CQL 的幕后实现的。

请教 Cassandra 专家，我真的不适合 Cassandra 用户吗？我真的应该忘记键值而只是尝试在我的用例中使用 CQL(如果可能的话)吗？

最佳答案

CQL 不仅仅是“糖”，尽管最初创建它是为了鼓励人们从 SQL 世界迁移。 CQL 之前的世界一团糟，许多客户端都使用 Thrift 协议(protocol)以不同的方式编写——但与 SQL 世界不同的是，Cassandra 每天都在改进，在每个版本中都带来新功能——而且通常这些改进中的每一个都需要一个新的“客户端版本”，能够处理生成的新型结果(例如考虑计数器或集合)或使用新功能的新语法。

我很高兴我有机会在 3 年多的时间里与 Thrift 客户端 (Pelops) 一起投入生产——这帮助我理解了很多 cassandra 世界、数据结构等等—— - 但现在我再也不会回到这样的客户那里了(即使它真的很棒!)。

一开始，Cassandra 是完全不同的，特别是曾经/曾经

“schema-less”意味着 CF 的每一行都可以包含不同数量的列，并且没有地方必须声明这些列。这给许多项目带来了灾难，在“运行时”添加新列的可能性导致您不知道可以在表中找到什么的情况。
“super-columns”一种已弃用的数据结构，由宽行取代

现在数据模型是稳定的 CQL 语法带来了更多的可读性，您现在可以迁移到您不太熟悉的任何项目，由于独特的语法，您可以了解应用程序如何与 DB 通信——更多—— - 每个新的 Cassandra 版本都会紧跟新版本的客户端。

CQL 不是 SQL 的“子集”，就像许多人写的那样:在某种程度上它是一个“超集”，因为它能够处理扩展基本语言的不同数据结构。

我的回答是:以键值对的方式思考，但仅使用 CQL

喂，卡罗

关于cassandra - 理解 Cassandra 背后的哲学，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/28494752/

24

4

0

文章推荐： python - 如何记录未捕获的崩溃的回溯？

文章推荐： ruby-on-rails - 你总是要运行 rake assets :precompile locally?

文章推荐： webrtc - 有没有办法访问 NAT 后面的 Web 服务器？

文章推荐： r - 如何在ggplot2中限制调色板

cassandra - 将数据从 cassandra 迁移到 cassandra
我们有 2 个 cassandra 集群，第一个有旧数据，第二个有新数据。现在我们想要将旧数据从第一个集群移动或复制到第二个集群。什么是最好的方法来做到这一点以及如何做到这一点？我们正在使用 DS
cassandra - OpsCenter for Cassandra 是否会降低 Cassandra 的速度？
我正在考虑安装 OpsCenter 来监控我们在 RackSpace VM 上运行的 24 节点 Cassandra 集群。过去我听说 OpsCenter 减慢了集群速度。我有点担心 OpsCente
cassandra - Cassandra 中没有回滚，那么 Cassandra 是如何删除失败的写入的呢？
假设我有一个复制因子(RF)= 2 的 2 节点集群。我使用一致性 2 触发插入。当客户端等待响应时，Cassandra 开始写入这 2 个节点。中间一个节点失败，无法完成写入，而另一节点上的写入成
cassandra - Apache Cassandra 与 Datastax Cassandra
已结束。此问题正在寻求书籍、工具、软件库等的推荐。它不满足 Stack Overflow guidelines 。目前不接受答案。我们不允许提出寻求书籍、工具、软件库等推荐的问题。您可以编辑问题，以
cassandra - Cassandra 是否可以就地更新？
我在 Cassandra 中有一个表，其中我用 1000 多个条目填充了一些行(每行有 10000 多列)。行中的条目更新非常频繁，基本上只是一个字段(它是一个整数)被更新为不同的值。列的所有其他值保
cassandra - Cassandra 在丢弃突变时返回给客户什么？
当Cassandra端有“掉落的突变”时，它是否向调用客户端返回相应的失败？或者即使在服务器端丢弃相应的突变并导致数据丢失，它总是成功响应调用事务的调用客户端？在一个特定实例中，当我们的 TPS 约
cassandra - Cassandra 的哈希值是否跨多个表具有相同的值？
我有一个 Multi-Tenancy 应用程序，其中 tenantId 将成为每个查询的一部分，因此我将其放入所有表的分区键中。例子: CREATE TABLE users { tenantId t
cassandra - Cassandra 中的更新不是反模式吗？
根据 Datastax 文档，在 Cassandra 中先读后写是一种反模式。每当我们在 CQLSH 中使用 UPDATE 或使用 Datastax 驱动程序来设置几列(带有 IF 和集合更新)时，
cassandra - Cassandra 将数据存储在哪个节点上？
是否有命令或任何方式可以知道 Cassandra 的哪些节点上存储了哪些数据？我对 Cassandra 很陌生，在谷歌上搜索这个问题并没有多少运气。谢谢! 最佳答案您可以使用 nodetool
cassandra - 低基数列的二级索引 cassandra
我们有一个包含 1500 万条记录的表，而我们的表是一个 10 节点的 cassandra 集群。我们有一列有接近 20 个可重复值。是否建议在此列上建立二级索引？最佳答案假设在该列上完全均匀分布
cassandra - Cassandra 中允许的最大列数是多少
Cassandra 发布了它的 technical limitations但没有提到允许的最大列数。是否有最大列数？我需要存储 400 多个字段。这在 Cassandra 中可能吗？最佳答案每行的
cassandra - Cassandra 表中的多列
我想知道当表中有多个非 PK 列时会发生什么。我读过这个例子: http://johnsanda.blogspot.co.uk/2012/10/why-i-am-ready-to-move-to-cq
cassandra - Cassandra 中的结果顺序
我有两个关于 Cassandra 查询结果的问题。当我在 Cassandra 中对表进行“完全”选择(即 select * from table )时，是否保证结果将按分区标记的递增顺序返回？例如
cassandra - Cassandra 的赫克托尔
我无法为 Cassandra 设置 Hector。我已经浏览了 documentation和 Cassandra wiki .这些文档的问题在于，那里的很多信息都已经过时或过时(或者我缺乏知识)。无论
cassandra - Cassandra 压力测试
我正在使用 DataStax Enterprise 中 cassandra 中提供的压力测试。如果有人知道的话，我也想要一些关于它和 cassandra 的信息。 - 首先，压力测试使用哪些节点？我的
cassandra - Cassandra 中的列排序
当我在 CQL 中创建表时，列的顺序是否必须精确不是在主键和中不是聚类列: CREATE TABLE user ( a ascii, b ascii, c ascii,
cassandra - 允许过滤实现@Cassandra
我有一张如下表: CREATE TABLE tab( categoryid text, id text, name text, author text, des
cassandra - cassandra 是行列数据库吗？
我正在尝试学习 Cassandra，但对术语感到困惑。很多情况下它表示该行存储键/值对。但是，当我定义一个表时，它更像是声明一个 SQL 表，即；您创建一个表并指定列名和数据类型。谁能澄清一下？
cassandra - Cassandra 中的数据审计
如何对 cassandra 数据实现审计？我正在寻找一个开源选项。 cassandra 是否有任何有助于审计的功能？我可以使用触发器将记录记录到表中吗？我关注了 Triggers示例并且能够将记录
cassandra - Cassandra 的可用性
我遇到了一个问题“me.prettyprint.hector.api.exceptions.HUnavailableException:: 可能没有足够的副本来处理一致性级别。”当我有 RF=1 时，

首页

博学

6Ren·AI

商城

cassandra - 理解 Cassandra 背后的哲学