- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我有一些关于漂亮汤的 html 抓取代码问题。我不知道如何浏览整个 html 文档来找到我要查找的其余内容。
我有这段代码可以在下面的 html 中找到并打印单词“Totem”。我希望能够循环浏览 html 并找到剩余的“一、二、三”和“出租”
用于查找第一个标签和文本的代码:
print(html.find('td', {'class': 'play'}).next_sibling.next_sibling.text)
将以下内容作为要抓取的示例 html:
<tr>
<td class="play">
<a href="#" class="audio-preview"><span class="play-button as_audio-button"></span></a>
<audio class="as_audio_preview" src="https://shopify.audiosalad.com/" >foo</audio>
</td>
**<td>Totem</td>**
<!--<td>$0.99</td>-->
<td class="buy">
<tr>
<td class="play">
<a href="#" class="audio-preview"><span class="play-button as_audio-button"></span></a>
<audio class="as_audio_preview" src="https://shopify.audiosalad.com/" >foo</audio>
</td>
**<td>One, Two, Three</td>**
<!--<td>$0.99</td>-->
<td class="buy">
<tr>
<td class="play">
<a href="#" class="audio-preview"><span class="play-button as_audio-button"></span></a>
<audio class="as_audio_preview" src="https://shopify.audiosalad.com/" >foo</audio>
</td>
**<td>Rent</td>**
<!--<td>$0.99</td>-->
<td class="buy">
最佳答案
试试这个。它应该为您获取您想要的内容:
from bs4 import BeautifulSoup
soup = BeautifulSoup(content,"lxml")
for items in soup.find_all(class_="play"):
data = items.find_next_sibling().text
print(data)
或者,您也可以这样尝试:
for items in soup.find_all(class_="play"):
data = items.find_next("td").text
print(data)
输出:
Totem
One, Two, Three
Rent
关于Python BeautifulSoup 查找 next_sibling,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48780530/
我有这样的xml test test1 我使用 pugix
我有一些关于漂亮汤的 html 抓取代码问题。我不知道如何浏览整个 html 文档来找到我要查找的其余内容。 我有这段代码可以在下面的 html 中找到并打印单词“Totem”。我希望能够循环浏览 h
我想从 this URL 中抓取 Restaurants| for rests in dining_soup.select("div.infos-restos"): for rest
我试图了解next_sibling 在BeautifulSoup 中的实际用法。我搜索了很多但找不到可以满足我要求的示例。但是,如果我尝试使用 next_sibling 从第一个 tr 开始获取第二个
所以我有一个扁平的层次结构 HTML: July 1 Top Gun "Location: Millennium Park" "Amenities: Please
因为我想删除 html 网站中重复的占位符,所以我使用 BeautifulSoup 的 .next_sibling 运算符。只要重复项在同一行,就可以正常工作(参见数据)。但有时它们之间有一个空行 -
我正在尝试 BeautifulSoup Docs 中的示例并发现它表现得很奇怪。当我尝试访问 next_sibling 值时,出现的不是“正文”,而是“\n”。 html_doc = """ The
我是一名优秀的程序员,十分优秀!