google-cloud-bigtable - Cloud Spanner 中的高性能计数器-6ren

google-cloud-bigtable - Cloud Spanner 中的高性能计数器

转载作者：行者123 更新时间：2023-12-02 20:03:26

26

4

我希望继续统计某些项目的计数，例如帖子的点赞和评论。写入速率可能很高，例如1K 点赞/秒。

即使结果集已建立索引，使用 SELECT COUNT 似乎也不可行，因为可能有几百万行需要计数。

我正在考虑使用分片计数器方法，其中特定计数器(给定帖子的点赞)由 N 分片/行组成。递增计数器将递增一个分片行的列值，而读取计数器将读取所有分片行并对计数值求和。使用 Spanner 的这种方法会有任何问题吗？

据我了解，在 Bigtable 中，对同一行的多次更新将在该行中创建单元格的新版本，因此，可能会导致行超出其大小限制。因此，在 Bigtable 中使用行作为分片计数器似乎是一个坏主意。 Spanner 有类似的问题吗？

最佳答案

I understand that in Bigtable, multiple updates to the same row will create new versions of cells in the row and as a result, you can cause a row to exceed its size limit. So using rows as sharded counters in Bigtable seems to be a bad idea. Does Spanner have any similar issues?

正如评论中所述，您可以使用 ReadModifyWrite Increment API，但需要注意的是，Bigtable 中的行事务操作(如 ReadModifyWrite)速度较慢。

但是，使用多行来表示单个计数器，然后使用前缀扫描一起读取这些行应该没问题。

关键是 use arbitrary prefixes on the row key在集群中的节点之间分配写入并避免热点。

关于google-cloud-bigtable - Cloud Spanner 中的高性能计数器，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55243667/

26

4

0

文章推荐： docker - docker中的NGINX无法获取真实用户IP

文章推荐： git - 如何在 Jenkins 的 pull-request 中获取 git 更改的文件

文章推荐： Angular 路由器 : Get route config that matched the current route

bigtable - 为什么 BigTable 有列族？
为什么 BigTable 被构造为“family:qualifier”的两级层次结构？具体来说，为什么要强制执行此操作而不是仅使用列，并且例如建议用户将其限定符命名为“vertical:column”
bigtable - Gmail 与 Bigtable 一起使用的一般架构是什么
Google 现在允许您使用 BigTable(在 Google Cloud Platform 中托管为名为“Cloud Bigtable”的产品)开发应用程序。但是，我找不到太多关于如何为其设计模式
google-cloud-bigtable - Bigtable 备份和冗余
Google Cloud Bigtable 看起来很棒，但是我对备份和冗余有一些疑问。是否有备份数据以防止人为错误的任何选项？集群当前在单个区域中运行 - 是否有任何方法可以缓解区域不可用的情况？
bigtable - 更长时间地维护 Google Bigtable 中的数据
我们有一些用例，希望在 Google Bigtable 中长期存储大量数据: 产品开发期间用于性能调整用于演示我们需要存储数据，但我们并不真正需要它始终“在线”。当前的成本瓶颈似乎是节点的成本，
google-cloud-bigtable - Cloud Bigtable 行数的性能
我想衡量 Cloud Bigtable 在获取具有特定前缀的键的许多行计数方面的性能。假设一个模式的行键在末尾带有 unix 时间戳，例如，event_id#unix_timestamp。如果我需
google-cloud-bigtable - Cloud Bigtable 推荐的最小表大小
根据Cloud Bigtable performance docs我应该有一定的数据量来保证最高的吞吐量。在“性能较慢的原因”下它说: The workload isn't appropriate
google-cloud-bigtable - 我可以原子地增加 BigTable 中的列值吗？
BigTable 是否支持类似于 INCR 的原子增量操作？在 Redis 中？ BT的Golang库中有这个函数-https://godoc.org/cloud.google.com/go/bigt
google-cloud-bigtable - 高可用性是否需要多个 Google BigTable 节点？
我们正在试用 BigTable 并进行容量规划。我们认为一个节点可以满足我们实现初期的需求，以后我们会根据需要添加更多节点。我唯一的问题是，我们是否需要多个节点才能提供高可用性？ (我对什么是“节点”
google-cloud-bigtable - 实现声明的 Cloud Bigtable 写入 QPS
我们已经设置了具有 5 个节点的 Bigtable 集群，GCP 控制台指出它应该支持 50K QPS @ 6ms 的读取和写入。我们正在尝试加载一个大型数据集(约 8 亿条记录)，其中约 50 个
google-cloud-bigtable - Google Cloud Bigtable 上的 TTL
我有一个只有一个列族的表，该列的 TTL 为 24 小时，但我需要在截止日期前删除一些数据。为了实现这个目标，我伪造了插入日期。例如:如果我需要在插入后 1 小时删除一行，我将插入日期设置为 23
google-cloud-bigtable - Google Cloud Bigtable 上的 TTL
我有一个只有一个列族的表，该列的 TTL 为 24 小时，但我需要在截止日期前删除一些数据。为了实现这个目标，我伪造了插入日期。例如:如果我需要在插入后 1 小时删除一行，我将插入日期设置为 23
google-cloud-bigtable - 使用 Deployment Manager 部署 Google Cloud Bigtable
我正在尝试使用以下 YAML 配置文件部署 Bigtable 实例: resources: - name: foo-bigtable-instance type: bigtableadmin.v2
Bigtable 实例
有人可以提供一个真实的例子来说明如何在 Bigtable 中构建数据吗？请从搜索引擎、社交网络或任何其他熟悉的角度讨论，清楚而务实地说明行 -> 列族 -> 列组合如何优于传统的规范化关系方法。最佳
bigtable - 如何在谷歌云平台之外连接谷歌bigtable
我创建了一个 Google Bigtable 集群。我正在尝试连接以下 this tutorial我试图下载他们的 cli 项目并构建它，但是当我尝试执行任何命令时它都会失败。我还尝试构建更简单的连接
避免热点的 Bigtable 行键方案？
避免热点的 Bigtable 行键方案？一家公司需要您在 Google Bigtable 中创建一个架构，以允许对过去 2 年的记录进行历史分析。收到的每条记录每 15 分钟发送一次，其中包含设备的
bigdata - Bigtable 性能影响列族
我们目前正在调查使用多个列族对我们的 bigtable 查询性能的影响。我们发现将列拆分为多个列族并不会提高性能。有没有人有过类似的经历？关于我们的基准设置的更多细节。此时，我们生产表中的每一行都包
bigtable - 如果所有值都被垃圾收集，是否会自动删除一行？
假设有一行包含列族和其中的列。该列族有一个 gc 策略，并且该列中的所有值都刚刚过期。那么，该行会发生什么情况？该行会被垃圾收集器删除吗？或者，它仍然存在并且可以访问吗？我检查了文档，但只发现 h
bigtable - 如果所有值都被垃圾收集，是否会自动删除一行？
假设有一行包含列族和其中的列。该列族有一个 gc 策略，并且该列中的所有值都刚刚过期。那么，该行会发生什么情况？该行会被垃圾收集器删除吗？或者，它仍然存在并且可以访问吗？我检查了文档，但只发现 h
go - BigTable 中多列的过滤器
来自 CBT 的文档 // READING OP HERE timestamp := bigtable.Now() mut := bigtable.NewMutation() mut.Set(colu
java - bigtable 可以存储多少片平板电脑？
来自bigtable的论文。 bigtable我读到了这个: Each METADATA row stores approximately 1KB of data in memory. With a

首页

博学

6Ren·AI

商城

google-cloud-bigtable - Cloud Spanner 中的高性能计数器