- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我使用hadoop apache创建了一个计数Bloom Bloom。但是,当我尝试在其中添加键时,出现NullPointerException。我试图以多种方式更改类结构,但仍然得到相同的结果。
这是我做的代码:
package package_name;
import java.io.IOException;
import java.util.ArrayList;
import java.util.Iterator;
import org.apache.hadoop.util.bloom.*;
public class CBF {
public static CountingBloomFilter CBF = new CountingBloomFilter();
public static void countingFilter (ArrayList<byte[]> CBF_Keys) throws IOException{
CBF_Keys= Keys.keyStringArray;
Iterator<byte[]> iter = CBF_Keys.iterator();
while (iter.hasNext()) {
byte[] temp = iter.next();
Key hadoop_key = new Key(temp, 2.0);
CBF.add(hadoop_key);
}
}
}
最佳答案
问题是CBF = new CountingBloomFilter()
。我们应该使用CountingBloomFilter(int vectorSize, int nbHash, int hashType)
而不是here,否则HashFunction
不会在父类Filter
中构造。
关于java - 在BloomFilter中添加键时出现NullPointerException,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18173558/
当我想在我的程序中使用bloomfilter时,其中有一些误报率。我不知道如何为这些会误判的单词创建一个whitelist?谁能给我一些指示? 最佳答案 如果您可以限制可能对 Bloom Filter
我读到了这个: http://spyced.blogspot.com/2009/01/all-you-ever-wanted-to-know-about.html 我的问题: 1.) Cassandr
我正在尝试为数据帧中的大量字符串创建布隆过滤器 - 约 1.2 亿。每个字符串平均有 20-25 个字符,总数据大小超过我们默认的 spark.driver.maxResultSize 1GB。我不想
我有一个巨大的 RDD(源),我需要从中创建一个 BloomFilter 数据,因此对用户数据的后续更新将只考虑真正的“差异”,没有重复。 看起来 BloomFilter 的大多数实现都是不可序列化的
我已将两个 ISO 文件合并为一个文件。这两个单独的 ISO 文件都是同一供应商但不同版本的 Linux 发行版。在我编写的程序中(如下所示),以 512 字节的 block 和 block 的 MD
我正在尝试使用 MurmurHash3 哈希函数编写布隆过滤器的 C++ 实现。我的实现基于此站点:http://blog.michaelschmatz.com/2016/04/11/how-to-w
我在 Apache spark 中使用了 Breeze 实现的 Bloom 过滤器。我的布隆过滤器需要 200,000,000 个键。但我面临以下异常: User class threw except
我有两个大型数据帧 [a] 其中一个包含由 id 标识的所有事件 [b] id 列表。我想使用 Spark 2.0.0 中的 stat.bloomFilter 实现根据 [b] 中的 id 过滤 [a
我是一名优秀的程序员,十分优秀!