gpt4 book ai didi

python - 在一个类中抓取一个类

转载 作者:太空宇宙 更新时间:2023-11-03 14:54:05 25 4
gpt4 key购买 nike

我想在 class_="_e4d" 中抓取 class_="href"。基本上是想使用 BeautifulSoup 在一个类中抓取一个类。

from bs4 import BeautifulSoup
import selenium.webdriver as webdriver

url = ("https://www.google.com/search?...")

def get_related_search(url):
driver = webdriver.Chrome("C:\\Users\\John\\bin\\chromedriver.exe")
driver.get(url)
soup = BeautifulSoup(driver.page_source)
relate_result = soup.find_all("p", class_="_e4b")
return relate_result[0]

relate_url = get_related_search(url)
print(relate_url)

结果:markup_type=markup_type))p class="_e4b"}{a href="/search?...a}{/p>

我现在想抓取 href 结果。我不确定下一步是什么。谢谢您的帮助。

注意:我用 {} 替换了 <> 因为它没有显示为 html 脚本

最佳答案

您实际上可以通过 CSS selector 一次性找到这个内部 a 元素:

links = soup.select("p._e4b a[href]")
for link in links:
print(link['href'])

p._e4b a[href] 将在 p 中找到所有具有 href 属性的 a 元素具有 _e4b 类的元素。

关于python - 在一个类中抓取一个类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43958347/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com