gpt4 book ai didi

solr - 使用 ZooKeeper 在 SolrCloud 中配置 DataImportHandler

转载 作者:行者123 更新时间:2023-12-04 08:27:41 26 4
gpt4 key购买 nike

我有一个像这样配置的 SolrCloud:exploration of SolrCloud ,不同的是我用的是Solr 4.0.0 Beta。简单的配置:

  • 默认端口上的 ZooKeeper 2181
  • 3 个运行在不同端口上的 Solr 实例

  • 这仅用于测试目的。所需的配置是 3 个 ZooKeeper 实例(每个 Solr 实例一个)。我设法使用 curl 命令索引一些 XML 文件。

    问题:
  • 如何配置 DIH/集合?我设法更改了 solrconfig.xml(数据导入处理程序的配置),在 lib 中添加了数据库连接的正确驱动程序,但在 solr 管理中我得到“对不起,没有定义数据导入处理程序!”可以在 zookeeper 中查看更改(我看到 data_config.xml),在 solr 管理面板中我可以看到 solrconfig.xml 的更新版本。
  • 在 Ubuntu 12.04 LTS 的单台或多台机器上进行 solrcloud 生产部署的任何好的教程(使用像前面提到的所需配置的 somthink)?

  • 任何意见,将不胜感激!提前致谢!

    最佳答案

    通常 DIH 配置与您是在 solrCloud 配置中使用单个 Solr 实例还是多个实例无关。 DIH 将在当前实例的 Lucene 索引中写入数据,然后由 zooKeeper 将其分散到其他实例中。

    确保您的 DIH 配置正确:

    在 solrconfig.xml 中,加载了所有必需的库。这意味着两个 DIH jar :

    <lib dir="../../../dist/" regex="solr-dataimporthandler-4.3.0.jar" />
    <lib dir="../../../dist/" regex="solr-dataimporthandler-extras-4.3.0.jar" />

    以及您可能需要的其他 jar(如数据库 JDBC 驱动程序等)。

    仍然在 solrconfig.xml 中确保声明了 DIH 处理程序,如下所示:
    <requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">
    <lst name="defaults">
    <str name="config">data-config.xml</str>
    </lst>
    </requestHandler>

    最后,您在 DIH 处理程序 (data-config.xml) 中声明的配置文件应该与 solrconfig.xml 位于相同的“conf”目录中,并且应该具有适当的内容,例如:
    <dataConfig>

    <dataSource type="JdbcDataSource" name="myDataSource" driver="oracle.jdbc.driver.OracleDriver" url="jdbc:oracle:thin:@someHost:1521:someDb" user="someUser" password="somePassword" batchSize="5000"/>

    <document name="myDoc" >
    <entity name="myDoc" dataSource="myDatasource" transformer="my.custom.Transformer" query="select col1, col2, col3 from table1 where whatever" />
    </document>

    </dataConfig>

    关于solr - 使用 ZooKeeper 在 SolrCloud 中配置 DataImportHandler,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12264783/

    26 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com