gpt4 book ai didi

python - 通过 Mechanize 绕过 404

转载 作者:行者123 更新时间:2023-11-28 18:50:32 24 4
gpt4 key购买 nike

我正在创建一个 Python 脚本来读取 URL 文件,但我知道并非所有这些都有效。我试图弄清楚如何解决这个问题并让它读取文件的下一行,而不是引发我在下面发布的错误。我知道我需要某种 if 语句,但我不太明白。

from mechanize import Browser
from BeautifulSoup import BeautifulSoup
import csv

me = open('C:\Python27\myfile.csv')
reader = csv.reader(me)
mech = Browser()

for url in me:
response = mech.open(url)
html = page.read()
soup = BeautifulSoup(html)
table = soup.find("table", border=3)

for row in table.findAll('tr')[2:]:
col = row.findAll('td')
BusinessName = col[0].string
Phone = col[1].string
Address = col[2].string
City = col[3].string
State = col[4].string
Zip = col[5].string
Restaurantinfo = (BusinessName, Phone, Address, City, State)
print "|".join(Restaurantinfo)

当我运行该代码块时,它引发了这个错误:

httperror_seek_wrapper: HTTP Error 404: Not Found

基本上我要问的是如何让 Python 忽略它并尝试下一个 URL。

最佳答案

如果您的文件中只有 url,那么每行编写一个 url 并使用如下代码可能会更简单:

from mechanize import Browser
from BeautifulSoup import BeautifulSoup


me = open('C:\Python27\myfile.csv')
mech = Browser()

for url in me.readlines():
...

如果你想保留你的代码,你必须使用:

for url in reader:
...

关于python - 通过 Mechanize 绕过 404,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13541540/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com