gpt4 book ai didi

testing - 您如何测试 Hyperloglog 的实现?

转载 作者:行者123 更新时间:2023-11-28 20:40:38 25 4
gpt4 key购买 nike

有那么多 Hyperloglog 实现,但是您如何验证/测试 Hyperloglog 实现?要检查它的“准确性”,它是“错误”绑定(bind)行为吗?只是扔一些静态测试用例看起来很无效。

更具体地说,有人改变了随机数例程,我怎么知道这不是一个灾难性的选择并通过一些自动化的、可重复的测试来展示?

任何人都可以在 github 或其他地方指出任何已知的良好测试,并且可能有一些解释吗?

最佳答案

好问题。首先,请注意,虽然 HyperLogLog 的理论基础提供了一些准确性指示,但测试您正在使用的实现至关重要。

测试应该使用随机数据集(也可以使用其他静态数据集),并且应该应用于不同的集合基数。如果您有任何测试自动化框架,那将是确保避免回归的自然场所,正如您上面所建议的那样。但是,请注意,要测量具有大基数的准确性,测试运行时间可能会令人望而却步。

您可以使用下面的实现作为引用。它包括抽取大量随机数的单元测试,并以固定的时间间隔检查准确性。

https://github.com/Microsoft/CardinalityEstimation

关于testing - 您如何测试 Hyperloglog 的实现?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34683370/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com