gpt4 book ai didi

python - 无法确定Cassandra中Select查询速度慢的原因

转载 作者:行者123 更新时间:2023-12-01 01:16:23 26 4
gpt4 key购买 nike

我在 cassandra 的表中有 1 亿行。架构是:id int, key varchar, row_hash varchar, version int PK 为:((version), id)。创建此架构的查询是:

c_sql = "CREATE TABLE IF NOT EXISTS {} (id varchar, version int, row_hash varchar, PRIMARY KEY((version), id))".format( self.table_name )

此语句是否将版本作为分区键?

此外,由于 #rows 不断增加,我的选择查询显然需要很长时间:

row_check_query = "SELECT {} FROM {} WHERE {}={} AND {}='{}' ".format( "row_hash", self.table_name, "version", self.version, "id", key )

最佳答案

是的,version 是分区键。 id 是您案例中的聚类列。

您可以使用 CQL Tracing 来分析您的性能问题 - https://docs.datastax.com/en/cql/3.3/cql/cql_reference/cqlshTracing.html

根据您的数据分布,您可能会遇到“宽行”情况,即单个 version 分区中有许多记录,必须读取非常大的分区可能需要时间。

关于python - 无法确定Cassandra中Select查询速度慢的原因,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54306132/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com