gpt4 book ai didi

apache - Nutch 2.1 urls 注入(inject)需要永远

转载 作者:行者123 更新时间:2023-12-01 03:50:48 25 4
gpt4 key购买 nike

我正在尝试按照 tutorial 在 Ubuntu 12.04 上部署 nutch 2.1 .一切顺利
直到我尝试将 url 注入(inject)数据库。当我输入 ($bin/nutch injection urls) 并按下
输入我得到

    InjectorJob: starting
InjectorJob: urlDir: urls

并一直呆在那里(几个小时),直到我决定取消执行。 urls 是一个目录
包含带有 url 的文件。我按照建议在 nutch-site.xml 中添加了代理和端口详细信息 here但这并没有解决。我尝试了 apache nutch 2.2.1 并且问题仍然存在。

如果您知道如何解决该问题,请帮助我!

提前致谢。

最佳答案

Ubuntu 默认主机中的环回 IP 地址为 127.0.1.1。 HBase(根据 this page)要求您的环回 IP 地址为 127.0.0.1。

Ubuntu /etc/hosts文件默认包含(myComputerName 是您的计算机名称):

127.0.0.1   localhost
127.0.1.1 myComputerName

使用 sudo gedit /etc/hosts更新您的主机文件如下:
127.0.0.1   localhost
127.0.0.1 myComputerName

重启 Ubuntu。 Nutch 应该不再有将 url 注入(inject) HBase 的问题。

关于apache - Nutch 2.1 urls 注入(inject)需要永远,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23050000/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com