gpt4 book ai didi

python - 网页抓取工具不会转到正确的页面

转载 作者:行者123 更新时间:2023-12-01 09:17:18 24 4
gpt4 key购买 nike

所以我一直尝试去http://ofcc.ohio.gov/Opportunities2#lt-126679-construction-bids获取投标 list 。然而,读取的数据始终来自主页,即: http://ofcc.ohio.gov/Opportunities2 。我已经用 Beautiful Soup 和 Scrapy 尝试过了,但没有效果。有什么建议吗?当我 curl 第一个网址时,它还会加载主页数据。代码:

    import scrapy

class QuotesSpider(scrapy.Spider):
name = "quotes"

def start_requests(self):
urls = [
'http://ofcc.ohio.gov/Opportunities2#lt-126679-construction-bids',
]
for url in urls:
yield scrapy.Request(url=url, callback=self.parse)

def parse(self, response):
page = response.url.split("/")[-2]
filename = 'construction%s.html' % page
with open(filename, 'wb') as f:
f.write(response.body)
self.log('Saved file %s' % filename)

最佳答案

只需点击 http://ofcc.ohio.gov/Opportunities2#lt-126679-construction-bids我一直在等待出价加载...这是网站问题吗?

您收到任何错误消息吗?你的问题不是很详细

关于python - 网页抓取工具不会转到正确的页面,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51126973/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com