gpt4 book ai didi

python-3.x - 使用 BeautifulSoup4 (Python3.x) 只能按 id 查找,不能按类查找

转载 作者:行者123 更新时间:2023-12-02 20:23:28 25 4
gpt4 key购买 nike

我是 BeautifulSoup4 的新手,遇到了一个看似简单的问题。我只能按id查找,不能按类(class)查找。例如,我正在查看一个网站,其中包含以下 html 部分:

enter image description here

现在,以下工作:

page_soup.findAll('div', {'id': 'page-content'})

而以下内容什么也没找到:

page_soup.findAll('div', {'class': 'main-container'})

所以我的问题是:“class”属性与“id”属性的处理方式是否不同?如果是这样,按类名搜索的正确方法是什么?

只是为了完成,虽然我认为这不重要,我通过使用page_source获得了html selenium 包的方法。

编辑:Here是此类页面的一个示例。如果我们检查上面的表格,包括球员的位置、年龄等,那么我们就会得到上面的 html 快照。

最佳答案

下面是我运行的命令,它对我来说非常有用

In [1]: from bs4 import BeautifulSoup

In [2]: import requests

In [3]: res = requests.get("http://www.spotrac.com/mlb/atlanta-braves/freddie-freeman-7359/")

In [4]: soup = BeautifulSoup(res.text,"lxml")

In [5]: len(soup.findAll('div', {'class': 'main-container'}))
Out[5]: 1

In [6]: soup = BeautifulSoup(res.text,"html5lib")

In [7]: len(soup.findAll('div', {'class': 'main-container'}))
Out[7]: 1

In [8]: import sys; sys.version
Out[8]: '3.6.2 (default, Jul 17 2017, 16:44:45) \n[GCC 4.2.1 Compatible Apple LLVM 8.1.0 (clang-802.0.42)]'

正如你所看到的,它在两个解析器中都适用于我。

关于python-3.x - 使用 BeautifulSoup4 (Python3.x) 只能按 id 查找,不能按类查找,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45991430/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com