gpt4 book ai didi

search - 像关系数据库一样使用 Lucene

转载 作者:行者123 更新时间:2023-12-04 19:24:16 24 4
gpt4 key购买 nike

我只是想知道我们是否可以在 lucene 中实现一些 RDBMS 功能。

例子:
1) 我有 10,000 个项目文档(pdf 文件),必须对其内容进行索引以供搜索。
2) 每个文件都与一个单一的项目相关。项目可以包含项目名称、编号、开始日期、结束日期、位置、类型等详细信息。

我必须在 pdf 文件的内容中搜索给定关键字,但在显示结果时,我想显示第 (2) 点中提到的项目元数据。

我的想法是在索引时将名为 projectId 的字段与每个 pdf 文件相关联。一旦我们得到它,我们将再次启动搜索以获取项目元数据。

这样我们就可以避免重复数据。此外,如果我们想更新项目元数据,我们最终只会在一个地方更新。否则,如果我们将这些元数据与所有 pdf doument 索引一起存储,我们最终将更新所有文档,这不是我正在寻找的方式。

请指教。

最佳答案

如果我理解正确,你有两个问题:

  • 我可以在 Lucene 中存储项目 ID 并使用它进行进一步搜索吗?是的你可以。这是一种常见的做法。
  • 我可以使用这个项目 id 在 Lucene 中搜索项目元数据吗?是的你可以。我不知道这是否是个好主意。这取决于您的元数据更新频率和您的访问模式。如果元数据是相对静态的,并且您只能通过 id 访问它,那么 Lucene 可能是存储它的好地方。否则,您可以使用项目 ID 作为数据库表的主键,这可能更合适。
  • 关于search - 像关系数据库一样使用 Lucene,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/828714/

    24 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com