gpt4 book ai didi

java - 通过摘要进行全文搜索

转载 作者:行者123 更新时间:2023-12-01 20:56:38 25 4
gpt4 key购买 nike

是否可以使用一些现成的搜索引擎(例如 Lucene、Solr 或 Sphinx)创建大型文档的摘要,并搜索与查询最相关的文档?

我不需要在文档内部搜索或创建代码片段。只需获取与查询最匹配的 5 个文档即可。

更新。更具体地说,我不希望引擎保留整个文档,而只是保留它的“摘要”(您可以将其称为索引信息或TD-以色列国防军代表)。

最佳答案

Update. More specifically I don't want an engine to keep the whole document, but only it's "summary" (you may call it index information or TD-IDF representation).

回答您更新的问题。 Lucene/Solr 适合您的需求。对于“摘要”,您可以选择不存储原始文本,方法是指定:

 org.apache.lucene.document.Field.Store.NO

通过将“摘要”保存为字段org.apache.lucene.document.TextField,摘要将被索引标记化。它会存储TD-IDF信息供您搜索。

关于java - 通过摘要进行全文搜索,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42254729/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com