gpt4 book ai didi

python - 使用 BeautifulSoup 通过 id 获取 div 的内容

转载 作者:太空狗 更新时间:2023-10-29 14:49:08 26 4
gpt4 key购买 nike

我正在使用 python2.7.6、urllib2 和 BeautifulSoup

从网站中提取 html 并存储在变量中。

如何使用 beautifulsoup 仅显示带有 id 的 div 的 html 内容?

<div id='theDiv'>
<p>div content</p>
<p>div stuff</p>
<p>div thing</p>

会是

<p>div content</p>
<p>div stuff</p>
<p>div thing</p>

最佳答案

加入div标签的元素.contents :

from bs4 import BeautifulSoup

data = """
<div id='theDiv'>
<p>div content</p>
<p>div stuff</p>
<p>div thing</p>
</div>
"""

soup = BeautifulSoup(data)
div = soup.find('div', id='theDiv')
print ''.join(map(str, div.contents))

打印:

<p>div content</p>
<p>div stuff</p>
<p>div thing</p>

关于python - 使用 BeautifulSoup 通过 id 获取 div 的内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25614702/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com