gpt4 book ai didi

Solr 8.4.1云: bin/post - File not Found problem

转载 作者:行者123 更新时间:2023-12-03 08:49:31 25 4
gpt4 key购买 nike

我是 Solr 新手,一直在学习 8.4.0 的教程。在成功遵循使用 SolrCloud 的 techproducts 示例后,我现在尝试使用无模式方法来索引一些 PDF 文件。为此,我再次使用教程中的以下内容来索引存储在 ~/Documents/pdf 文件夹中的几个文件:

bin/solr create -c localpdf -s 2 - rf 2
bin/post -c localpdf ~/Documents/pdf

执行上述命令时,出现以下错误:

SimplePostTool: WARNING: Response: <html>
<head>
<meta http-equiv="Content-Type" content="text/html;charset=utf-8"/>
<title>Error 404 Not Found</title>

</head>
<body><h2>HTTP ERROR 404</h2>
<p>Problem accessing /solr/localpdf/update/extract. Reason:
<pre> Not Found</pre></p>
</body>
</html>
SimplePostTool: WARNING: IOException while reading response: java.io.FileNotFoundException: http://localhost:8983/solr/localpdf/update/extract?resource.name=%2Fhome%2Fuser%2FDocuments%2Fpdf%2Ftest234.pdf&literal.id=%2Fhome%2Fuser%2FDocuments%2Fpdf%2Ftest234.pdf

使用 techproducts 运行相同的命令,即运行:

bin/post -c techproducts ~/Documents/pdf

至少找到文件(它给了我一些与 PDFBox 和一些字体相关的其他错误,但那是另一回事)

我可以添加其他文件,例如从 example/exampledocs 文件夹将 XML 添加到 localpdf,但不能添加 pdf。

我在这里缺少什么?

最佳答案

您必须configure your core / collection to load the extracting request handler - 否则不可用。 techproducts 核心默认执行此操作。将 jar 添加到要加载的 jar 列表中:

<lib dir="${solr.install.dir:../../..}/contrib/extraction/lib" regex=".*\.jar" />
​<lib dir="${solr.install.dir:../../..}/dist/" regex="solr-cell-\d.*\.jar" />

并添加请求处理程序定义(来自上面链接的指南):

<requestHandler name="/update/extract" class="org.apache.solr.handler.extraction.ExtractingRequestHandler">
<lst name="defaults">
<str name="fmap.Last-Modified">last_modified</str>
<str name="uprefix">ignored_</str>
</lst>
<!--Optional. Specify a path to a tika configuration file. See the Tika docs for details.-->
<str name="tika.config">/my/path/to/tika.config</str>
<!-- Optional. Specify one or more date formats to parse. See DateUtil.DEFAULT_DATE_FORMATS
for default date formats -->
<lst name="date.formats">
<str>yyyy-MM-dd</str>
</lst>
<!-- Optional. Specify an external file containing parser-specific properties.
This file is located in the same directory as solrconfig.xml by default.-->
<str name="parseContext.config">parseContext.xml</str>
</requestHandler>

关于Solr 8.4.1云: bin/post - File not Found problem,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59869554/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com