- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试让 Solr 与 Tika 一起工作,以便我可以在我的 Drupal 网站中索引 Word 和 PDF 文档。
我看过 Wiki page而这个 page它们表示在 solrconfig.xml 中添加一个 requestHandler。
我这样做了,现在 Solr 抛出了一个异常:
org.apache.solr.common.SolrException: Error loading class 'org.apache.solr.handler.extraction.ExtractingRequestHandler'
最佳答案
如果您从带有 jetty 设置的示例目录运行 Solr,它应该按原样运行,没有任何更改。
然而,for multicore setup you would need to copy the jars into the lib directory .
如果您检查示例文件夹中的 solrconfig,它将包含 solr 单元和提取库的 jar。
solrconfig.xml -
取消注释此行以包含所有 lib jar -
<lib dir="./lib" />
<lib dir="../../dist/" regex="apache-solr-cell-\d.*\.jar" />
<lib dir="../../contrib/extraction/lib" />
关于drupal - 让 ExtractingRequestHandler 在 Solr 中工作,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7918754/
我正在尝试发布一个文本多值字段以及一个 PDF 摘录。似乎只有一个字段值被添加到索引中。这是否需要以不同的方式传递? 当前发送相当于(通过 POST 值): http://localhost:8080
我正在利用 solr ExtractingRequestHandler 来提取和索引 HTML 内容。我的问题涉及它生成的提取链接部分。返回的提取内容在 HTML 源代码中不存在的位置插入了“rect
在构造我发送给它的文档的“内容”时,如何指示提取请求处理程序忽略元数据/ header 等? 例如,我创建了一个 MS Word 文档,其中只包含单词“SEARCHWORD”,没有其他任何内容。但是,
在构造我发送给它的文档的“内容”时,如何指示提取请求处理程序忽略元数据/ header 等? 例如,我创建了一个 MS Word 文档,其中只包含单词“SEARCHWORD”,没有其他任何内容。但是,
我正在公司开展一个需要 solr 的内部项目,但我无法将其链接到 Tika。我买了 apache solr 4 食谱,但我无法找到解决方案。 我将所需的 jar 文件复制到 lib 目录中 我在sol
我正在尝试让 Solr 与 Tika 一起工作,以便我可以在我的 Drupal 网站中索引 Word 和 PDF 文档。 我看过 Wiki page而这个 page它们表示在 solrconfig.x
您可以将 ExtractingRequestHandler 和 Tika 与以下任意一项一起使用吗?用于提取内容进行索引的压缩文件格式(zip、tar、gz 等)? 我使用curl 向solr 发送a
我是一名优秀的程序员,十分优秀!