gpt4 book ai didi

linux - 将 nutch 数据索引到 solr 时出错

转载 作者:太空宇宙 更新时间:2023-11-04 04:09:48 25 4
gpt4 key购买 nike

我正在尝试将我的爬网数据从 nutch 索引到 solr 中,但收到以下错误。任何帮助将不胜感激。

SOLRIndexWriter
solr.server.url : URL of the SOLR instance (mandatory)
solr.commit.size : buffer size when sending to SOLR (default 1000)
solr.mapping.file : name of the mapping file for fields (default solrindex-mapping.xml)
solr.auth : use authentication (default false)
solr.auth.username : use authentication (default false)
solr.auth : username for authentication
solr.auth.password : password for authentication


Exception in thread "main" java.io.IOException: Job failed!
at org.apache.hadoop.mapred.JobClient.runJob(JobClient.java:1357)
at org.apache.nutch.indexer.IndexingJob.index(IndexingJob.java:123)
at org.apache.nutch.indexer.IndexingJob.index(IndexingJob.java:81)
at org.apache.nutch.indexer.IndexingJob.index(IndexingJob.java:65)
at org.apache.nutch.crawl.Crawl.run(Crawl.java:155)
at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:65)
at org.apache.nutch.crawl.Crawl.main(Crawl.java:55)

最佳答案

你看到solr日志了吗?这些日志记录了错误原因。我曾经在 nutch 中遇到过同样的问题,并在 solr 日志中发现一条消息“未知字段主机”。编辑scheme.xml后,问题消失了。

关于linux - 将 nutch 数据索引到 solr 时出错,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19723259/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com