gpt4 book ai didi

python - 使用 beautiful soup 抓取数据时网页表结构出现问题

转载 作者:太空宇宙 更新时间:2023-11-03 19:05:01 24 4
gpt4 key购买 nike

我正在使用以下代码使用 beautiful Soup 从网页上的表格结构中抓取数据:

# -*- coding: cp1252 -*-
import csv
import urllib2
import sys
import urllib
import time
import mechanize
from bs4 import BeautifulSoup
from itertools import islice


page = urllib2.urlopen('http://www.t-mobile.de/tarifuebersicht-telefonieren-und-surfen/0,23786,25241-_,00.html#grp=0&dev=0').read()
soup = BeautifulSoup(page)
for row in soup('table', {'class' : 'wloCol5'}).tbody('tr'):
tds = row['td']
print tds

这段代码给了我 AttributeError: 'ResultSet' object has no attribute 'tbody' 错误。我正在对另一个运行没有任何故障的网页使用类似的代码。请告知此代码/网页结构可能存在什么问题导致此错误。

最佳答案

调用 soup('table', {...}) 会找到多个表,因此它返回一个类似列表的对象。

尝试如下:

for table in soup('table', {...}):
for tr in table("tr"):
...

关于python - 使用 beautiful soup 抓取数据时网页表结构出现问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14981561/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com