gpt4 book ai didi

python - BeautifulSoup 使用两个不同的 div 类查找数据

转载 作者:行者123 更新时间:2023-11-28 02:30:32 24 4
gpt4 key购买 nike

我正在尝试解析这个 html 网页,我想要网页中的特定数据。我在这个特定的类上使用 findall 函数。唯一的问题是,由于类冲突,它正在从网站端获取不必要的数据。我基本上想对包含“mainContent”和项目类名称的 div 类进行查找。我只找到了如何查找包含“空白”或“空白”的类。试图找到类名为“空白”和“空白”的东西的语法是什么?谢谢!

最佳答案

使用css selectors而不是 find_all():

#! /usr/bin/env python3
# -*- coding: UTF8 -*-from bs4 import BeautifulSoup

html_doc = """
<!DOCTYPE html>
<html lang="en-US">
<head>
<title>test</title>
</head>
<body>
<div class="alpha">not a match.</div>
<div class="beta">not a match.</div>
<div class="alpha beta">match.</div>
<div class="beta alpha">match.</div>
<p class="alpha beta">not match.</div>
</body>
</html>
"""

soup = BeautifulSoup(html_doc, 'html.parser')

print(soup.select("div.alpha.beta"))

关于python - BeautifulSoup 使用两个不同的 div 类查找数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51005547/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com