gpt4 book ai didi

ubuntu - 如何在服务器上运行 Scrapyd

转载 作者:行者123 更新时间:2023-12-04 18:27:52 27 4
gpt4 key购买 nike

截至最近,Scrapinghub 的免费包中不再提供定期作业,这是我用来运行我的 Scrapy 爬虫的工具。

因此,我决定使用Scrapyd反而。所以我继续建立了一个运行 Ubuntu 16.04 的虚拟服务器。 (这是我第一次设置和运行服务器,所以请耐心等待)

按照 scrapyd.readthedocs.io 上的说明进行操作我使用 pip 安装了 Scrapyd:

$ pip install scrapyd

(那是在我发现 Ubuntu 的推荐方式(使用 apt-get)实际上不再受支持之后,请参阅 Github )。

然后我使用 SSH 登录到我的服务器,并通过简单地运行来运行 Scrapyd

$ scrapyd

据我所知,一切看起来都很好:

2017-10-30 17:31:19+0000 [-] Log opened.
2017-10-30 17:31:19+0000 [-] twistd 16.0.0 (/usr/bin/python 2.7.12) starting up.
2017-10-30 17:31:19+0000 [-] reactor class: twisted.internet.epollreactor.EPollReactor.
2017-10-30 17:31:19+0000 [-] Site starting on 6800
2017-10-30 17:31:19+0000 [-] Starting factory <twisted.web.server.Site instance at 0x7f644752bfc8>
2017-10-30 17:31:19+0000 [Launcher] Scrapyd 1.2.0 started: max_proc=4, runner=u'scrapyd.runner'

当我访问我的 IP here 时,我希望看到一个 Web 界面(描述为 http://82.165.102.18:6800 ) .

相反,我只是收到错误消息“无法访问此站点 82.165.102.18 拒绝连接。”

当我尝试在本地运行 Scrapyd 时,一切正常,并且我在 http://localhost:6800/ 处获得了 Web 界面.

我尝试禁用防火墙 (UFW),但这没有帮助。

此时此刻,我已经迷失了方向。如果您有任何想法,请告诉我!

非常感谢!

最佳答案

如果您可以在本地访问 Scrapyd 实例,但不能通过网络访问,我怀疑 Scrapyd 仅在本地主机上监听。请务必在您的 scrapyd.conf 中包含此行:

bind_address = 0.0.0.0

它指示 Scrapyd 监听所有接口(interface)。 bind_address 默认为 127.0.0.1,因此默认情况下它仅监听本地主机。

关于ubuntu - 如何在服务器上运行 Scrapyd,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47021171/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com