- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
您能帮我理解我在这份文档中阅读的内容吗? https://crate.io/docs/reference/sql/partitioned_tables.html
在这些示例表中,id long
列不是 primary_key
;事实上,id
在这里不能是主键,因为如下所述“如果设置了主键,它必须出现在 PARTITION BY
子句中”
在我的应用程序中,我以前在 id string NOT NULL
上有一个 primary key
,但现在我想在生成日期在此表上添加分区列就像在示例 partition_date timestamp GENERATED ALWAYS AS date_trunc('day', created_at)
中一样。我读过在日期列上进行分区将有助于提高按时间段范围查询的速度(例如,计算今天的所有记录只会命中今天的分区),并帮助我归档较旧的数据帧(例如任何> 180天的数据) ),但我不想失去单个 PK 查找的性能。
既然我不能只做 PARTITIONED BY (partition_date)
,我最好是...
a) 从 id
中删除主键约束?我很紧张这会影响我的单行查找性能!在这种情况下,PK 必须在分区键中是有意义的,因为要查找 WHERE id = "abc-123"
理想情况下应该只需要命中一个节点。
或
b) 将两列都用作分区键,例如 PARTITIONED BY (id, partition_date)
-- 这看起来很奇怪,因为本能地,我想假设 id
会具有高基数并且对于分区列来说是一个糟糕的选择,并且“日”或“月”会更好,就像您文档中的示例所示。在这种情况下,我的 PK 查找是否命中了每个分区,或者它是否确切地知道要去哪里?如果我运行仅限于今天的聚合查询,它会命中每个分区还是只命中包含今天数据的分区?
最佳答案
这是一个很好的问题!由于分区是排序的“子表”,这有助于减少查询数据的大小。
主键影响 routing在 CrateDB 中,因此将其添加到分区表(这需要更广泛的路由)将拒绝 partitioned by clause 中的任何非主键列.因此,您的选择如下:
_id
列(用于查找)或发出 REFRESH TABLE
可能是可行的在 ID 查找之前。因为选项 b) 会导致困惑,我推荐选项 a)。但是,如果主键查找对您的应用程序至关重要并且预期的数据量不是那么大(几百万就可以了 - 当然取决于集群大小和机器规范),它可能在没有分区的情况下工作得很好!
干杯,克劳斯
关于Crate:为什么要求 PRIMARY KEY 列出现在 PARTITIONED BY 子句中?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41618884/
我似乎无法让它发挥作用。我已经尝试过在线样本,但没有一个正是我需要的。基本上我希望能够显示从给定日期过去的天数。我下面的示例是 HTML 和 PHP 的组合,出于某些原因我不得不这样做。 Date
Closed. This question needs to be more focused。它当前不接受答案。 想改善这个问题吗?更新问题,使其仅关注editing this post的一个问题。
在此处搜索“线程关联”的答案,我发现人们对此很感兴趣,但没有什么理由可以节省可能获得稳定的 QueryPerformanceTimer 结果。 假设一个现代操作系统和一个现代 2-4 插槽工作站/服务
我有一个称为main-app的聚合物元素:
我有一个表,我想在每个插入时间记录每个订单的时间戳。但是,我得到的时间戳值为零。 这是我的架构: CREATE TABLE IF NOT EXISTS orders( orde
我正在使用 MongoDB Atlas 来托管数据库并使用这个无服务器函数查询数据: import { NextApiRequest, NextApiResponse } from "next"; /
苹果卸下了转义键,并用OLED触摸条替换了它。这对emacs用户具有影响,特别是对于具有数十年肌肉内存力才能克服此变化的UNIX/emacs用户而言。幸运的是,触摸栏逃生键似乎总是在您需要的时候出现,
抱歉,我对 DbGrids 还很陌生。 我是否应该使用查询的字段编辑器并以某种方式添加一个捕获 TIMEDIFF 的新字段,然后将其添加为我的 DbGrid 中的列? 或者我可以/应该跳过字段编辑器并
正如一本相当古老的书XUnit Patterns所写,NUnit 2.0不会为每个测试创建新的测试夹具,因此,如果测试正在操纵夹具的某种状态,则该夹具会被共享并且可能导致各种不良副作用。 还是一样吗?
我知道自2016年4月以来,Youtube API的默认配额限制为1M。 如果要增加它,我们需要向Google 发送请求。 我想知道我们可以要求的配额限制的最大值是多少? 最佳答案 根据Google开
这个问题不太可能对任何 future 的访客有帮助;它只与一个较小的地理区域、一个特定的时间点或一个非常狭窄的情况相关,通常不适用于全世界的互联网受众。如需帮助使此问题更广泛适用,visit the
{ "size": 0, "query": { "range": { "LogTime": { "gte": "now-1d",
当我尝试从终端编译这个简单的代码时: #include int main(void) { printf("%f\n",sqrt(10)); return 0; } 使用 gcc mai
我正在尝试筛选抓取一个 html 页面,以便我可以从中提取所需的有值(value)的数据并将其放入文本文件中。到目前为止,一切进展顺利,直到我在 html 页面中遇到了这个: In inventor
这是我的 结果 MySQL 表的示例: 我想将特定用户的所有日期向前移动相同的时间间隔,以便该用户的最高日期是当前时间戳。我知道如何获取以天为单位的间隔: /* result is 823 */ SE
我有一个函数需要从主视图中的几个不同位置调用。我们称它为 updateFunction。 我这样声明: - (void)updateFunction { //updates some vari
我正在尝试找出如何以某种方式嵌套回调。 var alpha = function(callback){ var x = 5; if(x > 2){ callback()
为什么我收到RangeError:超出最大调用堆栈错误?我正在尝试解析文本以找到数学并解决它。它一直有效,直到我开始实现括号'。我试图找出错误,但就是无法弄清楚。 我的代码: var alg = {
我记得几年前,没有使用 SSL 的原因之一是它占用了大量资源,因此影响了应用程序的性能。 如今,以当前的技术,这仍然是一个需要牢记的点吗? 这个问题的出现是因为一位同事担心使用 SSL 会影响他的应用
我正在将我的数据库从 sqlserver 迁移到 mysql当我在 sqlserver 中使用 getDate() 函数时,mysql 中的替换是 Now()但是 Now() 没有返回 getDate
我是一名优秀的程序员,十分优秀!