- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
问题:
我需要比较 2 个哈希表实现(基本上是 HashMap
与另一个实现)并得出合理的结论。
我对 100% 的准确率不感兴趣,只是在我的估计中朝着正确的方向前进。
我不仅对每个操作的差异感兴趣,而且主要对哈希表作为“整体”的差异感兴趣。
我对速度没有严格的要求,所以如果其他实现合理慢我可以接受,但我确实期望/要求内存使用更好(因为其中一个哈希表由原始表支持)。
到目前为止我做了什么:
最初,我创建了自己的自定义“基准测试”,其中包含循环和多次提示 gc 的调用以感受差异,但我在网上阅读到使用标准工具更可靠/合适。
我的方法示例(MapInterface 只是一个包装器,因此我可以在实现之间切换。):
int[] keys = new int[10000000];
String[] values = new String[10000000];
for(int i = 0; i < keys.length; ++i) {
keys[i] = i;
values[i] = "" + i;
}
if(operation.equals("put", keys, values)) {
runPutOperation(map);
}
public static long[] runOperation(MapInterface map, Integer[] keys, String[] values) {
long min = Long.MAX_VALUE;
long max = Long.MIN_VALUE;
long run = 0;
for(int i = 0; i < 10; ++i) {
long start = System.currentTimeMillis();
for(int i = 0; i < keys.length; ++i) {
map.put(keys[i], values[i]);
}
long total = System.currentTimeMillis() - start;
System.out.println(total/1000d + " seconds");
if(total < min) {
min = time;
}
if(total > max) {
max = time;
}
run += time;
map = null;
map = createNewHashMap();
hintsToGC();
}
return new long[] {min, max, run};
}
public void hintsToGC() {
for(int i = 0; i < 20; ++i) {
System.out.print(". ");
System.gc();
try {
Thread.sleep(100);
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}
private HashMapInterface<String> createNewHashMap() {
if(jdk) {
return new JDKHashMapWrapper<String>();
}
else {
return new AlternativeHashMapWrapper<String>();
}
}
public class JDKHashMapWrapper implements HashMapInterface<String> {
HashMap<Integer, String> hashMap;
JDKHashMapWrapper() {
hashMap = new HashMap<Integer, String>();
}
public String put(Integer key, String value) {
return hashMap.put(key, value);
}
//etc
}
(我想测试put
、get
、contains
和内存利用率)
我能否确定使用我的方法可以获得合理的测量值?
如果不是,什么是最合适的工具,如何使用?
更新:
- 我还使用 SecureRandom 测试随机数(也是 ~10M 随机数)。
- 当哈希表调整大小时,我打印哈希表的逻辑大小/实际表的大小以获得负载因子
更新:
对于我的具体情况,我也对整数感兴趣,我的方法有哪些陷阱?
@dimo414 评论后更新:
Well at a minimum the hashtable as a "whole" isn't meaningful
我的意思是哈希表在运行时和内存消耗方面的各种负载下的行为。
Every data structure is a tradeoff of different methods
我同意。 我的权衡是内存改进的可接受访问惩罚
You need to identify what features you're interested in verifying
1)放(键,值);
2) 获取(键, 值);
3) 包含键(键);
4) 当哈希表中有很多条目时,以上所有
最佳答案
使用哈希表的一些关键考虑因素是“桶”分配的大小、冲突解决策略和数据的形状。本质上,哈希表获取应用程序提供的键,然后将其哈希为小于或等于分配的桶数的值。当两个键值散列到同一个桶时,实现必须解决冲突并返回正确的值。例如,每个桶都可以有一个排序的链表,然后搜索该链表。
如果您的数据恰好有很多冲突,那么您的性能将会受到影响,因为哈希表实现将花费太多时间来解决冲突。另一方面,如果你有非常多的桶,你会以牺牲内存为代价来解决碰撞问题。此外,如果条目数超过一定数量,Java 的内置 HashMap 实现将“重新散列”——我想这是一个值得避免的昂贵操作。
因为你的关键数据是1到10M的正整数,所以你的测试数据看起来不错。我还将确保针对给定测试将不同的哈希表实现初始化为相同的存储桶大小,否则这不是一个公平的比较。最后,我会在相当大的范围内改变存储桶大小,然后重新运行测试以查看实现如何改变它们的行为。
关于java - 我如何评估哈希表的实现? (引用HashMap),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31596577/
我有不同的结构,它们都包含一个 HashMap与 String作为键,但具有不同的值类型。例如,一个结构有一个类型为 HashMap 的成员, 另一个将有一个 HashMap 类型的成员, 等等。 我
我想制作一个包含学生姓名和科目的板,每个学生在每个科目中都有一个成绩(或者没有..他可以离开考试而不写,然后他的案子将是空的)。我只想使用 HashMap。我的意思是,它会是这样的: HashMap>
是否有内存和速度高效的方法来在 HashMap 中动态存储唯一键:值对? key 保证是唯一的,但它们的数量经常变化。插入和删除必须很快。 我所做的是包含有符号距离场的八叉树(非线性/完整)。八叉树经
有谁知道为什么选择通过 LinkedList 而不是另一个 Hashmap 来实现 HashMap 的存储桶。如果桶本身变成了 HashMap,那么 contains 或 get 的时间复杂度似乎是
我想创建一个具有嵌套结构的 HashMap,就像这个复杂的示例: { type: boy name: Phineas father: type: man
这个问题在这里已经有了答案: How do I create a global, mutable singleton? (7 个答案) 关闭 7 年前。 我想要一个可扩展的字典,将 Object 与
HashMap> hm = new HashMap>(); hm.put("Title1","Key1"); for(int i=0;i hm1 = new H
我必须修改当前代码以适应 Spring MVC。我有 HashMap hashmap = new HashMap(); request.setAttribute("dslrErrors", hashm
我正在尝试进行一些错误捕获。 错误应该检查数组的长度是否小于 2,并检查 HashMap 是否包含用户输入的键。 捕获的错误必须仅使用 if 语句,并且必须使用 .length() 方法,并且必须使用
在 stackoverflow 上提出另一个问题后,(Java- Why this program not throwing concurrent Modification exception)我开始
我有两个类,想使用 org.dozer.Mapper( http://dozer.sourceforge.net/ ) 将 Female 对象的属性映射到 Male 对象。 第一类是: public
As it currently stands, this question is not a good fit for our Q&A format. We expect answers to be
是否有任何方法可以检查 HashMap 是否包含一组特定的键(这些键是在数组中给出的)。当我尝试类似下面的代码时,它返回 false。 map.containsKey(arrayOf("2018-01
跟进我的问题:How To Access hash maps key when the key is an object 我想尝试这样的事情:webSearchHash.put(xfile.getPa
我有一个可扩展的 ListView ,对于每个 child ,我需要有 4 个“额外”或字符串或其他名称来调用它:- 子标题- 描述- 链接1- 链接2 跟着教程,创建 ListView 、不同的 p
我想确保这是正确的,因为如果不正确,它可能会破坏我的应用程序。 我有这个: private static HashMap> balance = new HashMap<>(); 如果我得到这样的值:
我想做以下事情: 为某个键查找Vec,并将其存储以备后用。 如果它不存在,则为键创建一个空的 Vec,但仍将其保存在变量中。 如何有效地做到这一点?自然地,我认为我可以使用 match: use st
我想做以下事情: 为某个键查找Vec,并将其存储以备后用。 如果它不存在,则为键创建一个空的 Vec,但仍将其保存在变量中。 如何有效地做到这一点?自然地,我认为我可以使用 match: use st
我想做以下事情: 为某个键查找Vec,并将其存储以备后用。 如果它不存在,则为键创建一个空的 Vec,但仍将其保存在变量中。 如何有效地做到这一点?自然地,我认为我可以使用 match: use st
我想做以下事情: 为某个键查找Vec,并将其存储以备后用。 如果它不存在,则为键创建一个空的 Vec,但仍将其保存在变量中。 如何有效地做到这一点?自然地,我认为我可以使用 match: use st
我是一名优秀的程序员,十分优秀!