gpt4 book ai didi

python - 如何编写一个 python 脚本来不断尝试网页直到它打开

转载 作者:太空宇宙 更新时间:2023-11-03 11:32:03 28 4
gpt4 key购买 nike

我们正在等待姐姐的结果。事实上,很多情况下,与印度政府有关。服务器很慢,流量很大。

于是,我想到了写一个python程序,不断尝试,直到服务器响应Http请求。但是程序:

import urllib
i=1
f = open("C:/Users/DELL/Desktop/neetpg.html",'w')
while(True):
try:
page = urllib.urlopen("http://www.nbe.gov.in/asr/neet_pdf/")
print "Done"
break
except:
print i
i += 1
continue
f.write(page.read())

print "check"

但是程序不能正常运行。我尝试用 facebook.com 替换 url,它仍然打印出数字。

此外,我想要实现的是,如果服务器确实响应,网页会加载 js 和 css 文件以及 html 文件,所有这些都应该在浏览器中打开。

我也从 http://docs.python.org/2/library/webbrowser.html 得到了提示并将程序更改为:

import webbrowser
i=1
while(True):
try:
webbrowser.open("http://www.nbe.gov.in/asr/neet_pdf/")
print "Done"
break
except:
print i
i += 1
continue
print "check"

但所有这一切都是在我的默认网络浏览器中打开一个新窗口,并将 url 设置为给定的内容,然后“打开它”。同时,在 python shell 上打印 Done 和 Check。

Web 浏览器未收到服务器响应,显示无法连接到 www.nbe.gov.in

如何实现?

编辑: 刚刚看到 facebook.com 脚本毕竟有效。它花了大约 15 次尝试,然后它发生了。 .html 文件已正确写入。使用所有 CSS,可能还有 JS。

为什么会这样,试了很多次,而我却可以轻松地从浏览器打开facebook.com。

最佳答案

selenium一试。

想法是不断打开页面,直到驱动程序看到正确的标题。如果它在那里,只需打破循环并保持页面打开:

from selenium import webdriver


driver = webdriver.Firefox()
while True:
driver.get("http://www.nbe.gov.in/asr/neet_pdf/")

if 'NEET-PG' in driver.title:
break

希望对您有所帮助。

关于python - 如何编写一个 python 脚本来不断尝试网页直到它打开,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16597568/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com