- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我正在 lucene 索引中搜索完全匹配的文档标题。为实现这一点,我有以下两种替代方法来为将被索引的文档创建字段。
方法一:
FieldType _contentFieldType = new FieldType();
_contentFieldType.setIndexed(true);
_contentFieldType.setStored(true);
Document doc = new Document();
doc.add(new Field("content", getContent(), _contentFieldType));
writer.addDocument(doc);
方法二:
Document doc = new Document();
doc.add(new StringField("content", getContent(), Store.YES));
writer.addDocument(doc);
然后我使用 TermQuery
创建查询并在 lucene 索引中搜索,但如果我使用第一种方法,我不会得到任何结果。第二种方法对我来说工作正常。
Query query = new TermQuery(new Term(searchQuery.fields().get(0), searchQuery.queryText()));
indexSearcher.search(query, Math.max(1, collector.getTotalHits()));
文档标题示例:文档标题实际上是文档的主题,是主题的层级路径。
Top/Arts/Animation/Audio
Top/Arts/Animation/Collectibles
Top/Arts/Animation/Stop-Motion
Top/Arts/Animation/Festivals
Top/Arts/Animation/News_and_Media
Top/Arts/Animation/Chats_and_Forums
Top/Arts/Animation/Training
Top/Arts/Animation/Voice_Actors
Top/Arts/Animation/Artists
比如说,我想搜索Top/Arts/Animation/Training
。我需要精确的字符串匹配,所以我使用了 TermQuery
。
我阅读了文档并了解了 Field 和 StringField。因此,如果 Store.Yes
作为参数传递,StringField 会被索引但不会被分析。但我的问题是,因为我在方法 1 中对 Field
同时使用了 setIndexed(true)
和 setStored(true)
,为什么我不这样做从方法 1 得到类似的结果?是因为如果我使用 Field 会执行一些额外的事情,还是因为使用了 TermQuery?使这两种方法不同的主要因素是什么?请帮助我了解它们之间的区别。
谢谢!
最佳答案
这就是我认为正在发生的事情。
您在第一种方法中使用了分析器
来索引哪些小写输入标记。
所以例如 Top/Arts/Animation/Training
这将存储如下
top/Arts/animation/training
现在,当您使用 TERMQUERY
搜索它时,termquery 实际上会搜索确切的字符串。即 Top/Arts/Animation/Training
由于索引中的小写字母,它不会匹配任何内容。
让我们谈谈第二种方法。由于您使用了 StringField,因此不会分析字段并将按原样存储。即您的索引在 StringField 案例中包含以下内容
Top/Arts/Animation/Training
现在,当您使用 TermQuery 进行搜索时,它将匹配,因为它是按原样存储的。
在第一种方法中得到结果
使用 QueryParser
来构建查询,而不是使用 TermQuery
,使用在索引时使用的相同分析器。
阅读此处了解 TERMQUERY
和 QUERYPARSER
之间的区别
what is the difference between TermQuery and QueryParser in Lucene 6.0?
编辑
stored 只是表示将原始字段值存储在索引中。以便在返回搜索结果的同时返回。搜索发生在索引上而不是存储值上。存储属性背后的原因是 lucene“分析”或将输入数据转换为更有效的形式,以便更快、更相关的搜索(使用不同的分析器和分词器)。不幸的是,经过分析的数据通常不再适合显示。设置“stored=true”保证可以以原始形式检索原始数据。
关于java - Lucene 中的 Field 和 StringField 有什么区别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40699497/
平时很少在jquery中用到this。查看代码时发现用到了,就调试出this的值,心想原来如此。还是挺有用的。这里总结一下this与$(this)的区别和使用。 $(this)生成的是什么?
使用单例类和应用程序范围的托管 bean 来保存应用程序数据有区别吗? 我需要查找某些 JNDI 资源,例如远程 bean 接口(interface),因此我为自己编写了一个单例来缓存我的引用并且只允
如果您仔细查看包含的图片,您会注意到您可以使用 Eclipse IDE 重构 Groovy 代码并将方法转换为闭包,反之亦然。那么,闭包到底是什么,它与方法有什么不同呢?有人可以举一个使用闭包的好例子
vagrant box repackage有什么区别( docs ) 和 vagrant package ( docs )? 我意识到 vagrant package仅适用于 VirtualBox 提
我想看看是否有人可以解释为什么以下代码适用于 valueOf 但不适用于其他代码。 import java.math.BigDecimal; public class Change { publ
这个问题已经有答案了: 已关闭12 年前。 Possible Duplicates: What is Closures/Lambda in PHP or Javascript in layman te
This question already has answers here: Vagrant, Docker, Puppet, Chef (3个答案) 2年前关闭。 docker和chef有什么共同
以下代码在95%的机器上产生相同的输出,但是在几台机器上却有所不同。在 Debug模式下,输出: Changing from New to Fin OK 但在 Release模式下: Changing
////Creating Object var Obj; // init Object Obj= {}; 它们之间有什么区别两个? 有没有可能把它变成一个单行? 这样使用有什么好处吗?
我想找出定时器服务之间的区别。我应该使用哪个以及何时使用。我正在使用 Jboss 应用服务器。 1) java.ejb.Schedule。 @Schedule注解或配置自xml。 2) javax.e
我发现在 C++ 中可以通过三种不同的方式将对象传递给函数。假设我的类(class)是这样的: class Test { int i; public: Test(int x);
有什么区别。 public class Test { public static void main(String args[]) { String toBeCast = "c
如果我有一列,设置为主索引,设置为INT。 如果我不将其设置为自动递增,而只是将唯一的随机整数插入其中,与自动递增相比,这是否会减慢 future 的查询速度? 如果我在主索引和唯一索引为 INT 的
这两种日期格式有什么区别。第一个给出实际时间,第二个给出时间购买添加时区偏移值。 NSDateFormatter * dateFormatter = [[NSDateFormatter alloc]
如果有一个函数,请说foo: function foo() { console.log('bar'); } 那么在 JavaScript 中,从另一个函数调用一个函数有什么区别,如下所示: f
关闭。这个问题是opinion-based 。目前不接受答案。 想要改进这个问题吗?更新问题,以便 editing this post 可以用事实和引文来回答它。 . 已关闭 4 年前。 Improv
代码是什么: class Time { private: int hours; int minutes; int seconds; pu
我知道这是非常基本的,但有人介意解释一下这两个数组声明之间的区别吗: #include array myints; ...和: int myints[5]; ...以及为什么 myints.size
我学会了如何根据 http://reference.sitepoint.com/css/specificity 计算 css 特异性但是,基于this reference,我不明白伪类(来自c)和伪元
为什么在运行 2) 时会出现额外的空行?对我来说 1 就像 2。那么为什么 2) 中的额外行? 1) export p1=$(cd $(dirname $0) && pwd) #
我是一名优秀的程序员,十分优秀!