gpt4 book ai didi

python - 使用 python lxml 抓取airbnb

转载 作者:太空宇宙 更新时间:2023-11-03 17:03:35 25 4
gpt4 key购买 nike

我正在尝试在爱彼迎房源上查找节点。该节点是

< div class="col-md-3 text-muted" data-reactid=".2e7if3twveo.0.0.0.0.1.6.0">< span data-reactid=".2e7if3twveo.0.0.0.0.1.6.0.0">The Space< /span> /div> 
<小时/>
import mechanize

br = mechanize.Browser()

url ='https://www.airbnb.com/rooms/5711344'
tree = html.fromstring(br.open(url).get_data())
els = tree.xpath('//div[@class="row"]/div[@class="col-md-3 text-muted"]')
for element in els:
if element.text.find('The Space') >= 0:

不知何故,“空间”无法检索。

最佳答案

这对我有用:我使用 BeautifulSoup 通过类属性获取 div,然后循环获取正确的 div。

import requests
from bs4 import BeautifulSoup

url = 'https://www.airbnb.com/rooms/5711344'
html = requests.get(url)
soup = BeautifulSoup(html.text, 'html.parser')
divs = soup.find_all('div', attrs={'class': 'col-md-3 text-muted'})
for div in divs:
space = div.find('span').text.strip()
if space == "The Space":
print(space)

关于python - 使用 python lxml 抓取airbnb,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34794626/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com