gpt4 book ai didi

python - 我可以使用 scrapy 抓取本地机器的 html 页面吗?

转载 作者:太空宇宙 更新时间:2023-11-04 00:55:09 29 4
gpt4 key购买 nike

我是 scrapy 的新手。我需要使用 scrapy 制作一个小演示。

我使用 scrapy 来抓取 stackoverflow,我成功了。我想在存储在我本地机器上的 html 页面上尝试这个。可能吗?

请帮帮我

最佳答案

是的,你可以。只需将允许的域保留为空白,并在 start_url 中将 html 文件的位置设为 file://home/file.html。代码将是这样的

class MySpider(Spider):
name = "myspider"
allowed_domains = []
start_urls = ["file:///home/file.html"]

关于python - 我可以使用 scrapy 抓取本地机器的 html 页面吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35451939/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com