- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试开始使用 lucene。我用来索引文档的代码是:
public void index(String type, String words) {
IndexWriter indexWriter = null;
try {
if (dir == null)
dir = createAndPropagate();
indexWriter = new IndexWriter(dir, new StandardAnalyzer(), true,
new KeepOnlyLastCommitDeletionPolicy(),
IndexWriter.MaxFieldLength.UNLIMITED);
Field wordsField = new Field(FIELD_WORDS, words, Field.Store.YES,
Field.Index.ANALYZED);
Field typeField = new Field(FIELD_TYPE, type, Field.Store.YES,
Field.Index.ANALYZED);
Document doc = new Document();
doc.add(wordsField);
doc.add(typeField);
indexWriter.addDocument(doc);
indexWriter.commit();
} catch (IOException e) {
logger.error("Problems while adding entry to index.", e);
} finally {
try {
if (indexWriter != null)
indexWriter.close();
} catch (IOException e) {
logger.error("Unable to close index writer.", e);
}
}
}
搜索看起来像这样:
public List<TagSearchEntity> searchFor(final String type, String words,
int amount) {
List<TagSearchEntity> result = new ArrayList<TagSearchEntity>();
try {
if (dir == null)
dir = createAndPropagate();
for (final Document doc : searchFor(dir, type, words, amount)) {
@SuppressWarnings("serial")
TagSearchEntity searchResult = new TagSearchEntity() {{
setType(type);
setWords(doc.getField(FIELD_WORDS).stringValue());
}};
result.add(searchResult);
}
} catch (IOException e) {
logger.error("Problems while searching", e);
}
return result;
}
private List<Document> searchFor(Directory indexDirectory, String type,
String words, int amount) throws IOException {
Searcher indexSearcher = new IndexSearcher(indexDirectory);
final Query tagQuery = new TermQuery(new Term(FIELD_WORDS, words));
final Query typeQuery = new TermQuery(new Term(FIELD_TYPE, type));
@SuppressWarnings("serial")
BooleanQuery query = new BooleanQuery() {{
add(tagQuery, BooleanClause.Occur.SHOULD);
add(typeQuery, BooleanClause.Occur.MUST);
}};
List<Document> result = new ArrayList<Document>();
for (ScoreDoc scoreDoc : indexSearcher.search(query, amount).scoreDocs) {
result.add(indexSearcher.doc(scoreDoc.doc));
}
indexSearcher.close();
return result;
}
我有两个用例。第一个添加某种类型的文档,然后搜索它,然后添加另一种类型的文档,然后搜索它,依此类推。另一个添加所有文档,然后搜索它们。第一个工作正常:
@Test
public void testSearch() {
search.index("type1", "test type1 for test purposes test test");
List<TagSearchEntity> result = search.searchFor("type1", "test", 10);
assertNotNull("Retrieved list should not be null.", result);
assertTrue("Retrieved list should not be empty.", !result.isEmpty());
search.index("type2", "test type2 for test purposes test test");
result.clear();
result = search.searchFor("type2", "test", 10);
assertTrue("Retrieved list should not be empty.", !result.isEmpty());
search.index("type3", "test type3 for test purposes test test");
result.clear();
result = search.searchFor("type3", "test", 10);
assertTrue("Retrieved list should not be empty.", !result.isEmpty());
}
但另一个似乎只索引最后一个文档:
@Test
public void testBuggy() {
search.index("type1", "test type1 for test purposes test test");
search.index("type2", "test type2 for test purposes test test");
search.index("type3", "test type3 for test purposes test test");
List<TagSearchEntity> result = search.searchFor("type3", "test", 10);
assertNotNull("Retrieved list should not be null.", result);
assertTrue("Retrieved list should not be empty.", !result.isEmpty());
result.clear();
result = search.searchFor("type2", "test", 10);
assertTrue("Retrieved list should not be empty.", !result.isEmpty());
result.clear();
result = search.searchFor("type1", "test", 10);
assertTrue("Retrieved list should not be empty.", !result.isEmpty());
}
它成功找到了type3
,但未能找到所有其他类型。如果我转移这些调用,它仍然会成功地仅找到最后一个索引文档。Lucene版本,我使用的是:
<dependency>
<groupId>org.apache.lucene</groupId>
<artifactId>lucene-core</artifactId>
<version>2.4.1</version>
</dependency>
<dependency>
<groupId>lucene</groupId>
<artifactId>lucene</artifactId>
<version>1.4.3</version>
</dependency>
我做错了什么?如何让它索引所有文档?
最佳答案
每次索引操作后都会创建一个新索引。第三个参数是 create
标志,它被设置为 true。根据documentation of IndexWriter ,如果设置了此标志,它将创建一个新索引或覆盖现有索引。将其设置为 false 以附加到现有索引。
关于java - Lucene 奇怪的行为,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4803830/
我想创建一个基于 jQuery 的非常简单的 html 编辑器(不是所见即所得)。 我的问题是如何制作 textarea或 div可能 在上面写一些文字 然后样式即标签(例如 some stuff 将
根据文档 isset 条款“测试此项目中是否已设置给定属性”。我不明白设置属性时 isset 返回 true 还是 false 在下面的代码片段中,当 env.JAVA_HOME 未设置时,java.
我正在尝试取消映射 o这是执行 :only 的默认命令( :help :only ),所以我尝试的第一件事是: nmap o 这种作品,除非我按 ,等待超过timeoutlen ms 然后按 o
我有以下型号: class MetaData(models.Model): created_at = models.DateTimeField(auto_now_add=True, auto_
下面列出了两行代码。两者对日期和时间的期望相同,但只有一个有效。我正在使用 R 3.1。 以下不起作用: DateTime2=strftime("08/13/2010 05:26:24.350", f
我有一个关于 C 代码的问题。 #include void foo(void){ int a; printf("%d\n",a); } void bar(void){
如果文件大小 > 8k,为什么读取的最后一个字节 = 0? private static final int GAP_SIZE = 8 * 1024; public static void main(
我有一个命令 Get-Testdata从不同来源检索测试数据并将这些数据存储到 PSObject以不同的值作为属性。然后将对象总数存储为数组,以便于操作、排序、计算等。 我的问题是我希望能够将这些数据
我正在使用 epoll 将大消息写入使用 HTTP 协议(protocol)的服务器。 fds 都设置为非阻塞,我正在使用边缘触发事件。我知道对于 EPOLLIN,我需要循环读取 fd,直到返回 EA
这对我来说听起来很奇怪: $test_1 = 'string'; $test_2 = '0'; var_dump(intval($test_1)); // Output: int 0 var_dump
这个问题在这里已经有了答案: Java: Integer equals vs. == (7 个回答) 7年前关闭。 请您解释以下行为。 public class EqAndRef { publ
Drupal 的行为到底是什么? 它为模块开发人员提供什么类型的服务层? 它映射到 jQuery.ready 的关系类型是什么? 最佳答案 长版:Drupal.behaviors 不仅仅是 jQuer
以下代码: dispatch_async(dispatch_get_global_queue(DISPATCH_QUEUE_PRIORITY_HIGH, 0), ^{ for (int i=0
人们可以将项目添加到数据库中。我让他们选择在此时添加它,或手动选择日期。 因此我得到了这个 HTML 结构。 (请注意,我将日期和时间选择器妥协为只有一行文本) Selec
创建了一个数据框: simpleDF is.na(simpleDF$vals) [1] TRUE TRUE FALSE > is.nan(simpleDF$vals) [1] FALSE TRU
我有一个大的 docker 镜像 A,我创建了一个新的 Dockerfile FROM A RUN rm /big-folder 我尝试使用以下方法构建图像: docker build --squas
我想知道以下情况下 JVM 的行为是什么: JVM 最小堆大小 = 500MB JVM 最大堆大小 = 2GB 操作系统有 1GB 内存 JVM启动后,程序运行一段时间后,使用内存超过1GB。我想知道
我们正在使用 spikeearrest 策略,但我们不了解其工作原理。峰值逮捕配置如下: 5pm 阅读文档,我们了解到,如果我们在一分钟内调用此流超过 5 次,则该策略将在第 5 次之后
我正在使用 cURL 发送 POST 请求: curl http://tarvos.local:8080/partial_Users/2 -d '{currentPage : 1, firstID :
我的表中有 6442670 条记录,我正在使用以下命令获取它们jdbctemplate 使用行号一次 1000000 个。以下是查询 select * from (select rowNum rn
我是一名优秀的程序员,十分优秀!