gpt4 book ai didi

java - 如何使用 Solr 或 Searchable 搜索域对象及其指向的物理文件

转载 作者:行者123 更新时间:2023-12-01 05:53:01 25 4
gpt4 key购买 nike

我有一个数字图书馆系统,我在其中存储元数据和数据库中物理文件的路径。文件可以是任何内容:纯文本、Word、PDF、MP3、JPEG、MP4...

如何为我的域对象和物理文件(或文件的某些文本提取)提供全文搜索。

我唯一的选择是将文档文本存储在域对象中吗?我确实需要能够检索域对象列表,无论搜索结果来自域对象还是物理文档。当然,存在使用文件路径的可能连接,并且我实际上将每个文档放入由 GUID 命名的文件夹中,因此连接就在那里。

我需要在 Grails 中执行此操作,最好使用 solr 或可搜索插件,但 Java 解决方案会有所帮助。

最佳答案

您不需要将内容存储在域对象中,只需在创建索引条目时将内容与域对象关联起来即可。我用过Apache POI提取我的内容,但还有更高级别的服务,例如 Apache Tika

你可以使用Lucene在java中对其进行编码直接但我建议 SOLR相反

grails searchable plugin基于Compass这是基于 Lucene

关于java - 如何使用 Solr 或 Searchable 搜索域对象及其指向的物理文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4000973/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com