- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我试图理解这个草图,但无法理解。如果我错了,请纠正我,但基本上,假设我有一个文本数据..单词..我有一个散列函数..它接受一个单词并创建一个整数散列,然后我将该散列转换为二进制位向量?正确的..然后我跟踪我从左边看到的第一个 1.. 以及那个 1 所在的位置(比如 , k)... 这个集合的基数是 2^k?
http://ravi-bhide.blogspot.com/2011/04/flajolet-martin-algorithm.html
但是...说我只有一个词。并且它的散列函数使得它生成的散列是 2^5,那么我猜有 5 个(??)尾随 0?所以它会预测 2^5 (??) 基数?听起来不对?我错过了什么
最佳答案
对于单个单词,R的分布是p = 1/2的几何分布,其标准差为sqrt(2) ≈ 1.41。
因此对于散列以 100000b 结尾的单词,算法确实会产生 25/0.77351 = 41.37。但其概率仅为1/64,符合R的标准差接近1的说法。
关于algorithm - flajolet martin 素描是如何工作的?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21870063/
我试图理解这个草图,但无法理解。如果我错了,请纠正我,但基本上,假设我有一个文本数据..单词..我有一个散列函数..它接受一个单词并创建一个整数散列,然后我将该散列转换为二进制位向量?正确的..然后我
以下是我为实现 Flajolet and Martin’s Algorithm 而编写的代码.我使用 Jenkins 哈希函数 生成数据的 32 位哈希值。该程序似乎遵循了该算法,但偏离了大约 20%
我是一名优秀的程序员,十分优秀!