gpt4 book ai didi

amazon-redshift - 用于 Redshift 的 Postgresql-hll(或其他 Hyperloglog 数据类型/结构)

转载 作者:行者123 更新时间:2023-11-29 13:52:12 26 4
gpt4 key购买 nike

需要能够报告唯一身份访问者,但希望避免预先计算每个可能的键排列和创建多个表。

作为一个简单的例子,假设我需要在包含以下列的表中报告每月唯一身份

  • 日期(月/年)
  • 页面编号
  • country_id
  • device_type_id
  • monthly_uniques

在 Druid 和 Redis 中,Hyperloglog 数据类型会处理这个问题(假设可以接受很小的误差),我可以通过任意维度组合运行查询并接收唯一值的可行估计.

我能在 PostgreSQL 世界中找到的最接近的是 postgresql-hll 插件,但它似乎适用于 PostgreSQL 9.0+。

有没有一种方法可以在 Redshift 中表示这一点,而无需预先计算或存储访问者 ID(大大增加表的大小,但允许使用 RedShift 的“近似计数”hll 实现)?

注意:RedShift 是首选平台,但我已经知道其他自托管 PostgreSQL 分支可以支持它,例如 CitusDB。寻找使用 RedShift 执行此操作的方法。

最佳答案

关于amazon-redshift - 用于 Redshift 的 Postgresql-hll(或其他 Hyperloglog 数据类型/结构),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39023179/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com