gpt4 book ai didi

python - beautifulsoup 解析时出现问题

转载 作者:行者123 更新时间:2023-12-01 06:07:49 24 4
gpt4 key购买 nike

我正在尝试解析以下网页 link 。代码如下:

import urllib2
import sys
from BeautifulSoup import BeautifulSoup

url = 'http://www.etsy.com/teams/list'
source = urllib2.urlopen(url)

soup = BeautifulSoup(source)
print soup.prettify()

print len(soup('h3')) #to print the no of occurances of h3
h3s = soup.findAll('h3') #finding the same as above
print len(h3s)

问题是,它打印 1. 而网页包含至少 10 个“h3”。我无法弄清楚问题出在哪里我正在使用 python 2.7 和 BeautifulSoup 3.0.7

最佳答案

我建议使用 lxml相反:

>>> import lxml.html
>>> doc = lxml.html.parse('http://www.etsy.com/teams/list')
>>> len(doc.xpath('//h3'))
<<< 10

关于python - beautifulsoup 解析时出现问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7263422/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com