gpt4 book ai didi

java - Solr 从索引中提取数据到 XML 文件

转载 作者:太空宇宙 更新时间:2023-11-04 07:52:50 24 4
gpt4 key购买 nike

我们有客户提供的索引文件,现在希望通过删除重复文档来重新索引它们

Solr deduplication

为此,我必须从索引中读取数据,并生成 XML 文件或 CSV 文件,然后通过消除重复项来对它们进行索引

(如果我错了,请纠正我,我没有找到任何其他方法来做到这一点)

我知道使用 Lucene 可以做到这一点,但我想知道如何使用 solr 做到这一点

最佳答案

您可以通过将wt参数设置为xml来更改导出格式...&wt=xml 在您的 Solr 查询中。

这会将结果导出到 xml。因此,如果您搜索 *,您将获得完整内容 - 取决于 limit 参数。

http://wiki.apache.org/solr/CoreQueryParameters#wt

这也适用于 csv:http://wiki.apache.org/solr/CSVResponseWriter

关于java - Solr 从索引中提取数据到 XML 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14157617/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com