drupal - 让 ExtractingRequestHandler 在 Solr 中工作-6ren

drupal - 让 ExtractingRequestHandler 在 Solr 中工作

转载作者：行者123 更新时间：2023-12-01 01:23:56

24

4

我正在尝试让 Solr 与 Tika 一起工作，以便我可以在我的 Drupal 网站中索引 Word 和 PDF 文档。

我看过 Wiki page而这个 page它们表示在 solrconfig.xml 中添加一个 requestHandler。

我这样做了，现在 Solr 抛出了一个异常:

org.apache.solr.common.SolrException: Error loading class 'org.apache.solr.handler.extraction.ExtractingRequestHandler'

我做了一些搜索，发现其他人也有这个问题，但没有简单的解决办法。我正在使用 Solr 3.4.0 在 Windows Server 2003 .关于如何解决这个问题的任何想法？

作为旁注，我有 Drupal 使用 Solr 进行搜索，并且正在运行。但是我无法工作的是让 Solr 索引 PDF 和 Word 文档。我确信这是大多数网站的共同需求，但我已经花了数天时间，我无法相信它的文档记录很差而且很难弄清楚。

最佳答案

如果您从带有 jetty 设置的示例目录运行 Solr，它应该按原样运行，没有任何更改。

然而，for multicore setup you would need to copy the jars into the lib directory .

如果您检查示例文件夹中的 solrconfig，它将包含 solr 单元和提取库的 jar。

solrconfig.xml -

取消注释此行以包含所有 lib jar -

<lib dir="./lib" />

将这些文件夹中的 jar 文件复制到您的多核 lib 文件夹中。
这些 jar 用于提取。 (Apache pdfbox、poi、fontbox 等)

<lib dir="../../dist/" regex="apache-solr-cell-\d.*\.jar" />
<lib dir="../../contrib/extraction/lib" />

当您启动 Solr 时，您应该会看到所有的 jars 已加载。
应该让你工作。

关于drupal - 让 ExtractingRequestHandler 在 Solr 中工作，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/7918754/

24

4

0

文章推荐： python - argparse 更新参数的选择

文章推荐： jquery - 鼠标悬停触发按键事件

文章推荐： JQuery 使用属性切片对象

solr - ExtractingRequestHandler - 你如何发布多值文字字段？
我正在尝试发布一个文本多值字段以及一个 PDF 摘录。似乎只有一个字段值被添加到索引中。这是否需要以不同的方式传递？当前发送相当于(通过 POST 值): http://localhost:8080
Solr ExtractingRequestHandler 在链接中提取 "rect"
我正在利用 solr ExtractingRequestHandler 来提取和索引 HTML 内容。我的问题涉及它生成的提取链接部分。返回的提取内容在 HTML 源代码中不存在的位置插入了“rect
solr - 如何指示 ExtractingRequestHandler 仅解析文档的主体？
在构造我发送给它的文档的“内容”时，如何指示提取请求处理程序忽略元数据/ header 等？例如，我创建了一个 MS Word 文档，其中只包含单词“SEARCHWORD”，没有其他任何内容。但是，
solr - 如何指示 ExtractingRequestHandler 仅解析文档的主体？
在构造我发送给它的文档的“内容”时，如何指示提取请求处理程序忽略元数据/ header 等？例如，我创建了一个 MS Word 文档，其中只包含单词“SEARCHWORD”，没有其他任何内容。但是，
java - solr.extraction.ExtractingRequestHandler ClassNotFoundException
我正在公司开展一个需要 solr 的内部项目，但我无法将其链接到 Tika。我买了 apache solr 4 食谱，但我无法找到解决方案。我将所需的 jar 文件复制到 lib 目录中我在sol
drupal - 让 ExtractingRequestHandler 在 Solr 中工作
我正在尝试让 Solr 与 Tika 一起工作，以便我可以在我的 Drupal 网站中索引 Word 和 PDF 文档。我看过 Wiki page而这个 page它们表示在 solrconfig.x
java - 使用 Solr CELL 的 ExtractingRequestHandler 从包格式中索引/提取文件
您可以将 ExtractingRequestHandler 和 Tika 与以下任意一项一起使用吗？用于提取内容进行索引的压缩文件格式(zip、tar、gz 等)？我使用curl 向solr 发送a

首页

博学

6Ren·AI

商城

drupal - 让 ExtractingRequestHandler 在 Solr 中工作