gpt4 book ai didi

Python BeautifulSoup 查找 next_sibling

转载 作者:太空宇宙 更新时间:2023-11-04 04:49:18 28 4
gpt4 key购买 nike

我有一些关于漂亮汤的 html 抓取代码问题。我不知道如何浏览整个 html 文档来找到我要查找的其余内容。

我有这段代码可以在下面的 html 中找到并打印单词“Totem”。我希望能够循环浏览 html 并找到剩余的“一、二、三”和“出租”

用于查找第一个标签和文本的代码:

print(html.find('td', {'class': 'play'}).next_sibling.next_sibling.text)

将以下内容作为要抓取的示例 html:

<tr>
<td class="play">

<a href="#" class="audio-preview"><span class="play-button as_audio-button"></span></a>
<audio class="as_audio_preview" src="https://shopify.audiosalad.com/" >foo</audio>

</td>
**<td>Totem</td>**
<!--<td>$0.99</td>-->
<td class="buy">


<tr>
<td class="play">

<a href="#" class="audio-preview"><span class="play-button as_audio-button"></span></a>
<audio class="as_audio_preview" src="https://shopify.audiosalad.com/" >foo</audio>

</td>
**<td>One, Two, Three</td>**
<!--<td>$0.99</td>-->
<td class="buy">


<tr>
<td class="play">

<a href="#" class="audio-preview"><span class="play-button as_audio-button"></span></a>
<audio class="as_audio_preview" src="https://shopify.audiosalad.com/" >foo</audio>

</td>
**<td>Rent</td>**
<!--<td>$0.99</td>-->
<td class="buy">

最佳答案

试试这个。它应该为您获取您想要的内容:

from bs4 import BeautifulSoup

soup = BeautifulSoup(content,"lxml")
for items in soup.find_all(class_="play"):
data = items.find_next_sibling().text
print(data)

或者,您也可以这样尝试:

for items in soup.find_all(class_="play"):
data = items.find_next("td").text
print(data)

输出:

Totem
One, Two, Three
Rent

关于Python BeautifulSoup 查找 next_sibling,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48780530/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com