gpt4 book ai didi

java - 将多个可搜索文件添加到一个 Solr-index-document

转载 作者:行者123 更新时间:2023-12-01 05:37:39 28 4
gpt4 key购买 nike

有没有一种方法或最佳实践可以使用提取处理程序将多个文件(例如 2 个 pdf 和 1 个 doc)添加到一个 solr-index-doc 中?查询时的结果应该看起来像这样:

<result name="response">
<str name="id">123</str>

<doc>
<arr name="attr_content">
content of pdf-1
</arr>
</doc>

<doc>
<arr name="attr_content">
content of pdf-2
</arr>
</doc>

<doc>
<arr name="attr_content">
content of doc-1
</arr>
</doc>

</result>

在我的 java 应用程序中,我将文件添加到 Solr-Index 中,就像只添加一个文件一样:

ContentStreamUpdateRequest up = new ContentStreamUpdateRequest("/update/extract");
up.addFile(new File("c:\\document1.pdf"));
up.setParam("literal.id", solrId);
up.setAction(AbstractUpdateRequest.ACTION.COMMIT, true, true);
solr.request(up);

最佳答案

它只允许将一个文件作为附件附加。
Solr 确实允许对 zip 文件建立索引 ( patch ),这将索引文件的内容。
因此,您可以将文件打包成 zip 并将其提供给 Solr,该文件将作为单个文档进行索引。

关于java - 将多个可搜索文件添加到一个 Solr-index-document,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7892310/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com