- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
经过多年的关系数据库打交道,我很舒服地被洗脑成规范化地思考表、列和行。 Cassandra 仍然让我无法完全理解它。
我理解它更多的是持久化映射,您只能查询这些映射的唯一键,但我的理解是不完整的。
是的,我是 RTFM。不过,有人能给我一个关于 Cassandra 如何构建数据与 SQL 数据库的简洁明了的描述吗?我的意思是,1000 英尺的视野,它的工作原理有何不同?
例如,在 Ebay 技术博客上,它说:
Don’t think of a relational table.
Instead, think of a nested, sorted map data structure.Source: http://www.ebaytechblog.com/2012/07/16/cassandra-data-modeling-best-practices-part-1/
最佳答案
注意:由于最初的问题是关于 Cassandra 的,这将是本答案的重点。虽然 Cassandra 和其他非关系 (NoSQL) 数据存储通常共享相似的概念,但不能假设此处详述的想法适用于其他非关系数据存储。
解决此问题的最佳方法是记住,构建数据模型以适合您的查询是标准做法(对于 Cassandra)。主要区别在于,RDBMS 表是以高效的数据存储为主要焦点构建的。在 Cassandra(非关系)世界中,主要关注点会改变您希望查询的外观。通常,这可能会转化为以多种方式存储相同的冗余数据……没关系。这在 DataStax 文档 Comparing the Cassandra Data Model to a Relational Database 中有解释。
假设我有以下用户表:
CREATE TABLE users (
username TEXT,
firstname TEXT,
lastname TEXT,
phone TEXT,
PRIMARY KEY (username));
username | firstname | lastname | phone
------------------------------------------------
mreynolds | Malcolm | Reynolds | 111-555-1234
jcobb | Jayne | Cobb | 111-555-3464
sbook | Derial | Book | 111-555-2349
stam | Simon | Tam | 111-555-8899
users
表将允许我通过
username
查询我的用户,因为这是我们的主键。但是如果我们想通过电话号码查询数据呢?您可能想在
phone
上添加二级索引,但
phone
的基数可能与
username
一样高。解决这个问题的正确方法是创建一个新表,让您可以通过电话查询。注意:此模型假设
username
和
phone
都是唯一的。
CREATE TABLE usersbyphone (
phone TEXT,
username TEXT,
firstname TEXT,
lastname TEXT,
PRIMARY KEY (phone));
usersbyphone
表上的主键,如下所示:
PRIMARY KEY (phone,username));
phone
是我们的分区键(确定存储该行的分区的键),而
username
是我们的聚类键(确定我们的磁盘排序顺序的键)。在复合主键中一起使用这两个将确保唯一性。这将允许我们像这样选择我们的
usersbyphone
表:
SELECT username, firstname, lastnamea, phone FROM usersbyphone;
username | firstname | lastname | phone
------------------------------------------------
hwashburne| Hoban | Washburne| 111-555-1212
jcobb | Jayne | Cobb | 111-555-3464
mreynolds | Malcolm | Reynolds | 111-555-1234
sbook | Derial | Book | 111-555-2349
stam | Simon | Tam | 111-555-8899
zwashburne| Zoe | Washburne| 111-555-1212
usersbyphone
表不会替换
users
表......它与它一起工作。您将对该数据集有一些查询需要由
users
表提供服务,还有一些需要由
usersbyphone
表提供服务。缺点是保持两个表同步是在数据库之外完成的,通常由您的应用程序代码完成。这是一个示例,展示了您的思维在非关系范式中必须有何不同。
users
数据存储在一个看起来像这样的结构中:
RowKey:mreynolds
=> (column=, value=, timestamp=1374546754299000)
=> (column=firstname, value=Malcolm, timestamp=1374546754299000)
=> (column=lastname, value=Reynolds, timestamp=1374546754299000)
=> (column=phone, value=111-555-1234, timestamp=1374546754299000)
------------------------------------------------------
RowKey:hwashburne
=> (column=, value=, timestamp=1374546757815000)
=> (column=firstname, value=Hoban, timestamp=1374546757815000)
=> (column=lastname, value=Washburne, timestamp=1374546757815000)
=> (column=phone, value=111-555-1212, timestamp=1374546757815000)
------------------------------------------------------
RowKey:zwashburne
=> (column=, value=, timestamp=1374546761055000)
=> (column=firstname, value=Zoe, timestamp=1374546761055000)
=> (column=lastname, value=Washburne, timestamp=1374546761055000)
=> (column=phone, value=111-555-1212, timestamp=1374546761055000)
usersbyphone
表与
users
表看起来有些不同:
RowKey:111-555-1234
=> (column=mreynolds, value=, timestamp=1374546754299000)
=> (column=mreynolds:firstname, value=Malcolm, timestamp=1374546754299000)
=> (column=mreynolds:lastname, value=Reynolds, timestamp=1374546754299000)
------------------------------------------------------
RowKey:111-555-1212
=> (column=hwashburne, value=, timestamp=1374546757815000)
=> (column=hwashburne:firstname, value=Hoban, timestamp=1374546757815000)
=> (column=hwashburne:lastname, value=Washburne, timestamp=1374546757815000)
=> (column=zwashburne, value=, timestamp=1374546761055000)
=> (column=zwashburne:firstname, value=Zoe, timestamp=1374546761055000)
=> (column=zwashburne:lastname, value=Washburne, timestamp=1374546761055000)
关于cassandra - 熟悉 SQL 的人员迁移到 Cassandra/NoSQL 的概述,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25838195/
我最近开始从事一个 Sails 项目。它目前在迁移表下具有以下格式的迁移。 20160826122004-create_users_table.js 'use strict'; module.expo
当我尝试迁移时 doctrine:migrations:migrate ,我收到此异常:“元数据存储不是最新的,请运行 sync-metadata-storage 命令来解决此问题。”。这仅在尝试在生
我在 ec2 linux 7 上有一个 MarkLogic 服务器。我想将它迁移到 linux 6。我将 ebs 移动到新的 linux 6 并将其安装在 /var/opt/MarkLogic . 我
我对 OpenID 很好奇。虽然我同意统一凭证的想法很棒,但我有一些保留意见。什么是防止 OpenID 提供商发疯并持有他们拥有的 OpenID 帐户直到您支付 n 美元?如果我决定不喜欢这个提供商,
使用 SQL 很容易做到这一点,但我需要编写一个我不熟悉的 Knex 迁移脚本。以下代码在 order 表中行的末尾添加了 order_id 列。我想在 id 之后添加 order_id。我该怎么做?
使用 SQL 很容易做到这一点,但我需要编写一个我不熟悉的 Knex 迁移脚本。以下代码在 order 表中行的末尾添加了 order_id 列。我想在 id 之后添加 order_id。我该怎么做?
我想通过在 Yii2 中的迁移添加一个新列,使用以下代码: public function up() { $this->addColumn('news', 'priority', $this-
我正在尝试在 SQLDelight 的表中添加更多列。我做了一个迁移文件 1.sqm .在迁移文件中,它给出了找不到表的错误。 我的 build.gradle.kts: sqldelight {
我有一个与 Flyway DB 迁移相关的问题。通常如何管理处理相同 DB 模式的多个项目(微服务)。每个项目中的 Flyway 迁移脚本如果被其他项目修改,则不允许启动。他们是否有任何文档或最佳实践
我是 Laravel 的新手。我做了一份待办事项申请作为一项学校作业。我们必须使用迁移来创建我们的数据库。 我使用迁移创建了 2 个表。我的问题是:如果你第一次在你的电脑上运行这个项目,有没有办法自动
我正在尝试在 Laravel 中创建外键,但是当我使用 artisan 迁移表时,出现以下错误: [Illuminate\Database\QueryException] SQLSTATE[HY000
我从 Django 1.7 升级到 Django 1.9。我有多次迁移。升级后我无法再创建新的数据库。 问题是“django manage.py migrate”运行检查。检查导入应用程序 URL。这
我在创建数据迁移方面遇到了困难。我的应用程序使用两个数据库。我在 settings.py 中配置了数据库,并创建了一个像 Django docs 中一样的路由器. # settings.py DB_H
我有一个像这样的sql结构: CREATE TABLE resources ( id SERIAL PRIMARY KEY, title TEXT NOT NULL, created_at
我正在尝试使用模式构建器向表添加枚举选项(不丢失当前数据集)。 我真正能够找到的关于列更改的唯一信息是 http://www.flipflops.org/2013/05/25/modify-an-ex
我尝试转移到一些 CMake 程序中,并且有一个从 xml 生成头文件的函数。 生成文件.am adaptor_glue.hpp: dbus_introspect.xml $(DBUSXX_X
我想将文件移至我的 iOS 应用程序的 CoreData 存储 ../Library/Application Support/MyApp/ 至 ../Documents/Stores/ 我可以使用 N
有没有人对数据迁移进出 NetSuite 有丰富的经验?我必须将 DB2 表导出到 MySQL,处理数据,然后导出到一个 CSV 文件中。然后获取帐户的 CSV 文件并再次操作数据以使帐户从我们的旧系
我正在尝试在 Django 上建立一个博客。我已经走到了创建模型的地步。他们在这里: from django.db import models import uuid class Users(mode
我最近使用 bluehost 上的 AutoSSL 工具将网站迁移到 HTTPS。我在内容中看到一些失真,例如缺少背景颜色、表格位移、缺少_logos 等。 有谁知道 HTTPS 迁移效果如何影响样式
我是一名优秀的程序员,十分优秀!