- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我们创建了一个具有 9 个节点的 cassandra 集群。每一颗都配备 4 核和 16G RAM。我们正在编写 15-2500 万条包含 28 列的记录。
我们设计的数据模型如下(我只是重命名了列并缩短了实际架构以使其简洁)。
CREATE TABLE main_table(
col1 ... col28,
PRIMARY KEY((col1,col2),col_date,col_with_some_seq_number))
WITH CLUSTERING ORDER BY (col_date DESC,col_with_some_seq_number desc) AND default_time_to_live = 5270400;
CREATE MATERIALIZED VIEW mv_for_main_table AS
SELECT [col1.. col11],
FROM main_table
WHERE col1 IS NOT NULL AND col2 IS NOT NULL AND col_date IS NOT NULL AND col_with_some_seq_number IS NOT NULL
PRIMARY KEY ((col1),col2, col_date, col_with_some_seq_number)
WITH CLUSTERING ORDER BY (col_date DESC, col_with_some_seq_number DESC, col2 DESC);
Its just moving one of the partition key to clustering key in materialized view.
我们正在从spark加载数据,并且没有修改任何cassandra相关配置。
在摄取大约 1.5 亿条记录后,摄取开始失败,每个节点都出现大量突变失败。
物化 View 是否存在性能问题?或者我使用的定义效率不高?
我们尝试了一些配置更改,例如减少并发写入、吞吐量 MB。经过所有尝试后,我们放弃了物化 View ,然后一切都开始正常运行。
我们已经做了足够的测试,得出的结论是,只有在包含物化 View 之后,写入才会大幅变慢,并且突变也会被丢弃。
我们计划为上述配置使用单独的表而不是物化 View ,但我想知道我们使用的物化 View 或数据模型是否有任何错误。
最佳答案
深入了解物化 View (MV) 的地方:http://www.doanduyhai.com/blog/?p=1930
当有MV时,基表的一个分区上有一个锁。这个本地锁是有成本的(参见我的博文)
关于您的硬件大小,我还有另一句话,4CPU 低于官方建议的 8 CPU:http://cassandra.apache.org/doc/latest/operating/hardware.html
Cassandra 中的写入工作负载受 CPU 限制。在您的情况下,Spark 也使用您的 CPU,这可能可以解释您的瓶颈。
请在此处发布 dstat
和 htop
的屏幕截图
关于cassandra - Cassandra MaterializedViews 的性能问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41035790/
我们创建了一个具有 9 个节点的 cassandra 集群。每一颗都配备 4 核和 16G RAM。我们正在编写 15-2500 万条包含 28 列的记录。 我们设计的数据模型如下(我只是重命名了列并
我在 Cassandra 中有一些数据。说 create table MyTable { id text PRIMARY KEY, data text, updated_on
我是一名优秀的程序员,十分优秀!