gpt4 book ai didi

python - Scrapy、Splash和连接被对方​​拒绝: 10061

转载 作者:行者123 更新时间:2023-12-02 21:10:14 26 4
gpt4 key购买 nike

我在 Javascript 驱动的网站上使用 scrapy withsplash。但是,我无法传递 Connection was returned by other side: 10061 错误。

我得到这样的日志:

[scrapy.downloadermiddlewares.retry] DEBUG: Retrying 
<GET https://www2.deloitte.com/ch/en/misc/search.html#country=All#qr=accounting
via http://localhost:8050/render.html> (failed 1 times): Connection
was refused by other side: 10061: No connection could be made because
the target machine actively refused it..

以及指向扭曲的回溯:

twisted.internet.error.ConnectionRefusedError: Connection was refused 
by other side: 10061: No connection could be made because the target
machine actively refused it..

我已经检查了设置中的所有条目,尝试了各种USER_AGENTSROBOT条目,但没有运气。还尝试使用 --disable-private-mode 启动启动,但没有效果。

奇怪的是,只需将相同的网址复制粘贴到浏览器中就可以完美地工作。

我使用普通命令行 scrapy,以及通过 API。有趣的是,当使用 API 时,当然,在 PyCharm 中单击错误消息中目标的 url,主题标签 # 会被其转义代码替换。所以我很困惑在平视显示器下这是否是另一个问题或者两者是否相关。

甚至尝试查看通过 Wireshark 和 Fiddler 发送的包,但无法很好地理解结果,因为我以前从未使用过这些工具。

如有任何建议,我们将不胜感激。

最佳答案

终于找到了罪魁祸首。这确实是与 docker 容器的连接。

首先,我必须使用以下命令检索 docker 容器 IP

docker-machine ip

在 Docker 终端中。接下来,我必须调整 scrapy settings.py 文件中的 SPLASH_URL 以指向 docker-machine ip 而不是 localhost:8050,瞧……它起作用了。

不幸的是,到目前为止我所看到的消息来源对此还不清楚,所以我希望这对其他第一次设置飞溅的可怜的灵魂有一些用处。

关于python - Scrapy、Splash和连接被对方​​拒绝: 10061,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55082855/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com