gpt4 book ai didi

mongodb - 错误 : while start Apache nutch with mongodb

转载 作者:可可西里 更新时间:2023-11-01 10:51:25 24 4
gpt4 key购买 nike

当我尝试运行时,出现以下错误,在 mongodb 中记录一个连接被接受并立即结束。如何解决?

$ bin/crawl conf/urls/seeds.txt tuto 1 未指定 SOLRURL。跳过索引。 注入(inject)种子 URL /e/apache-nutch/apache-nutch-2.3.1/runtime/local/bin/nutch inject conf/urls/seeds.txt -crawlId tuto InjectorJob:开始于 2016-10-01 18:15:14 InjectorJob:注入(inject) urlDir:conf/urls/seeds.txt InjectorJob:使用类 org.apache.gora.mongodb.store.MongoStore 作为 Gora 存储类。 InjectorJob:java.lang.NullPointerException 在 java.lang.ProcessBuilder.start(ProcessBuilder.java:1010) 在 org.apache.hadoop.util.Shell.runCommand(Shell.java:482) 在 org.apache.hadoop.util.Shell.run(Shell.java:455) 在 org.apache.hadoop.util.Shell$ShellCommandExecutor.execute(Shell.java:702) 在 org.apache.hadoop.util.Shell.execCommand(Shell.java:791) 在 org.apache.hadoop.util.Shell.execCommand(Shell.java:774) 在 org.apache.hadoop.fs.RawLocalFileSystem.setPermission(RawLocalFileSystem.java:646) 在 org.apache.hadoop.fs.RawLocalFileSystem.mkdirs(RawLocalFileSystem.java:434) 在 org.apache.hadoop.fs.FilterFileSystem.mkdirs(FilterFileSystem.java:281) 在 org.apache.hadoop.mapreduce.JobSubmissionFiles.getStagingDir(JobSubmissionFiles.java:125) 在 org.apache.hadoop.mapreduce.JobSubmitter.submitJobInternal(JobSubmitter.java:348) 在 org.apache.hadoop.mapreduce.Job$10.run(Job.java:1285) 在 org.apache.hadoop.mapreduce.Job$10.run(Job.java:1282) 在 java.security.AccessController.doPrivileged( native 方法) 在 javax.security.auth.Subject.doAs(Subject.java:415) 在 org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1614) 在 org.apache.hadoop.mapreduce.Job.submit(Job.java:1282) 在 org.apache.hadoop.mapreduce.Job.waitForCompletion(Job.java:1303) 在 org.apache.nutch.util.NutchJob.waitForCompletion(NutchJob.java:115) 在 org.apache.nutch.crawl.InjectorJob.run(InjectorJob.java:231) 在 org.apache.nutch.crawl.InjectorJob.inject(InjectorJob.java:252) 在 org.apache.nutch.crawl.InjectorJob.run(InjectorJob.java:275) 在 org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:70) 在 org.apache.nutch.crawl.InjectorJob.main(InjectorJob.java:284)

最佳答案

我相信最新版本的 Nutch 使用

# bin/nutch inject seedDirectory/

这至少对我有用。

关于mongodb - 错误 : while start Apache nutch with mongodb,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39806842/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com