gpt4 book ai didi

xml - Solr DataImportHandler 不适用于 XML 文件

转载 作者:行者123 更新时间:2023-12-05 08:02:09 24 4
gpt4 key购买 nike

我是 Solr 的新手。我成功地通过 DIH 从我的 sql 数据库中索引了数据。现在我想导入 xml 文件并通过 DIH 对它们进行索引,但它不起作用!我的 data-config.xml 如下所示:

<dataConfig>
<dataSource type="FileDataSource" encoding="UTF-8" />
<document>
<entity name="dir"
processor="FileListEntityProcessor"
baseDir="/bla/test2"
fileName=".*xml"
stream="true"
recursive="false"
rootEntity="false">
<entity name="PubmedArticle"
processor="XPathEntityProcessor"
transformer="RegexTransformer"
stream="true"
forEach="/PubmedArticle"
url="${dir.fileAbsolutePath}">


<field column="journal" xpath="//Name[.='journal']/following-sibling::Value/text()" />
<field column="authors" xpath="//Name[.='authors']/following-sibling::Value/text()" />

..etc

我在 schema.xml 中有以下字段:

<field name="journal" type="text" indexed="true" stored="true" required="true" />
<field name="authors" type="text" indexed="true" stored="true" required="true" />

当我运行 Solr 时,我没有得到任何错误,也没有文档被索引:

<str name="Total **Rows Fetched**">**2000**</str>
<str name="Total **Documents Skipped**">**0**</str>
<str name="Full Dump Started">2012-02-01 14:59:17</str>
<str name="">Indexing completed. **Added/Updated: 0 documents.** Deleted 0 documents.

谁能告诉我我做错了什么?!我什至仔细检查了路径语法...

最佳答案

我建议查看类似问题的答案:

Need help indexing XML files into Solr using DataImportHandler

使用像 groovy 这样的脚本语言要简单得多,也更容易测试。

关于xml - Solr DataImportHandler 不适用于 XML 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9097223/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com