gpt4 book ai didi

java - Lucene:如何存储文件内容?

转载 作者:行者123 更新时间:2023-12-02 00:11:31 27 4
gpt4 key购买 nike

我正在尝试索引和存储文件内容(纯文本),但似乎使用这种方式是不可能的:

protected Document getDocument(File f) throws Exception {
Document doc = new Document();
Field contents = new Field("contents", new FileReader(f));
Field filename = new Field("filename", f.getName(), Field.Store.YES, Field.Index.ANALYZED);
doc.add(contents);
return doc;
}

如何存储纯文本文件的内容(不带任何标签)?

最佳答案

只需读取文件内容并使用另一个 Field 构造函数,例如

protected Document getDocument(File f) throws Exception {
Document doc = new Document();
Field contents = new Field("contents", new Scanner(f).useDelimiter("\\A").next(), Store.YES, Index.NO); // you should actually close the scanner
Field filename = new Field("filename", f.getName(), Store.YES, Index.ANALYZED);
doc.add(contents);
doc.add(filename);
return doc;
}

关于java - Lucene:如何存储文件内容?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12727868/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com