- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我遇到了一个问题。我正在做一个迷你网络爬虫。现在拥有一个高效的 HashMap 很重要。我只想要只有插入和查找的键/值数据结构。
我知道 Lucene 可以完成这项工作,只需要有两个字段:键和值;但它有效率吗?还有其他更简单的解决方案吗?
Ps:它可以是 PHP 或 Java,但我更喜欢 PHP。
注意:我需要它被持久化。并且它会打开和关闭几次。
最佳答案
如果您想要的只是一个非庞大数据集的快速、持久的键值存储,Lucene 可能不是最佳解决方案 - Berkeley DB 将是显而易见的选择。也就是说,Grant Ingersoll 在今年的 Lucene Revolution 大会上就此发表了演讲。他故意带着支持 Lucene 的偏见来回答这个问题,并与几位听众就当代文档数据库(如 CouchDB)提供了哪些 Lucene 没有提供的内容进行了交流。对于最终可能需要二级索引的任何非大型数据集,我认为这是一个很好的解决方案。 Lucene 的键/值查找性能不会像 Berkeley DB、CouchDB、Tokyo Tyrant 等那样快,但它仍然非常快,对于许多应用程序来说已经足够了。我认为他在最近的笔记本电脑上测量了大约 50 毫秒的键/值查找。如果稍后您需要添加二级索引(就像您可能会在网络抓取的结果上一样),与那些产品相比,使用 Lucene 会更容易。
BDB 等其他工具的编码比 Lucene 更简单。但如果这是一个问题,只需使用 Solr,它可以通过简单的 HTTP 调用轻松添加文档和搜索(您需要修改 schema.xml 配置文件中的字段,否则,Solr 应该准备好-开箱即用)。
现在,如果您的数据集太大而无法在一台机器上合理地容纳,分布式键值存储(如 Project Voldemort 或 Riak)可能更易于设置和管理。但是 Lucene 可以让您在一台机器上走得更远,尤其是如果您没有索引很多字段 - 至少 TB,我猜。
如果您确实使用 Lucene,我会仔细考虑除了您想要搜索的键之外是否真的没有任何属性 - 不妨在第一次存储它们,因为 Lucene 使它变得容易.
关于java - Lucene 是 Key/Value HashMap 的好选择吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4670497/
我有不同的结构,它们都包含一个 HashMap与 String作为键,但具有不同的值类型。例如,一个结构有一个类型为 HashMap 的成员, 另一个将有一个 HashMap 类型的成员, 等等。 我
我想制作一个包含学生姓名和科目的板,每个学生在每个科目中都有一个成绩(或者没有..他可以离开考试而不写,然后他的案子将是空的)。我只想使用 HashMap。我的意思是,它会是这样的: HashMap>
是否有内存和速度高效的方法来在 HashMap 中动态存储唯一键:值对? key 保证是唯一的,但它们的数量经常变化。插入和删除必须很快。 我所做的是包含有符号距离场的八叉树(非线性/完整)。八叉树经
有谁知道为什么选择通过 LinkedList 而不是另一个 Hashmap 来实现 HashMap 的存储桶。如果桶本身变成了 HashMap,那么 contains 或 get 的时间复杂度似乎是
我想创建一个具有嵌套结构的 HashMap,就像这个复杂的示例: { type: boy name: Phineas father: type: man
这个问题在这里已经有了答案: How do I create a global, mutable singleton? (7 个答案) 关闭 7 年前。 我想要一个可扩展的字典,将 Object 与
HashMap> hm = new HashMap>(); hm.put("Title1","Key1"); for(int i=0;i hm1 = new H
我必须修改当前代码以适应 Spring MVC。我有 HashMap hashmap = new HashMap(); request.setAttribute("dslrErrors", hashm
我正在尝试进行一些错误捕获。 错误应该检查数组的长度是否小于 2,并检查 HashMap 是否包含用户输入的键。 捕获的错误必须仅使用 if 语句,并且必须使用 .length() 方法,并且必须使用
在 stackoverflow 上提出另一个问题后,(Java- Why this program not throwing concurrent Modification exception)我开始
我有两个类,想使用 org.dozer.Mapper( http://dozer.sourceforge.net/ ) 将 Female 对象的属性映射到 Male 对象。 第一类是: public
As it currently stands, this question is not a good fit for our Q&A format. We expect answers to be
是否有任何方法可以检查 HashMap 是否包含一组特定的键(这些键是在数组中给出的)。当我尝试类似下面的代码时,它返回 false。 map.containsKey(arrayOf("2018-01
跟进我的问题:How To Access hash maps key when the key is an object 我想尝试这样的事情:webSearchHash.put(xfile.getPa
我有一个可扩展的 ListView ,对于每个 child ,我需要有 4 个“额外”或字符串或其他名称来调用它:- 子标题- 描述- 链接1- 链接2 跟着教程,创建 ListView 、不同的 p
我想确保这是正确的,因为如果不正确,它可能会破坏我的应用程序。 我有这个: private static HashMap> balance = new HashMap<>(); 如果我得到这样的值:
我想做以下事情: 为某个键查找Vec,并将其存储以备后用。 如果它不存在,则为键创建一个空的 Vec,但仍将其保存在变量中。 如何有效地做到这一点?自然地,我认为我可以使用 match: use st
我想做以下事情: 为某个键查找Vec,并将其存储以备后用。 如果它不存在,则为键创建一个空的 Vec,但仍将其保存在变量中。 如何有效地做到这一点?自然地,我认为我可以使用 match: use st
我想做以下事情: 为某个键查找Vec,并将其存储以备后用。 如果它不存在,则为键创建一个空的 Vec,但仍将其保存在变量中。 如何有效地做到这一点?自然地,我认为我可以使用 match: use st
我想做以下事情: 为某个键查找Vec,并将其存储以备后用。 如果它不存在,则为键创建一个空的 Vec,但仍将其保存在变量中。 如何有效地做到这一点?自然地,我认为我可以使用 match: use st
我是一名优秀的程序员,十分优秀!