gpt4 book ai didi

python - BeautifulSoup4 Python 3.4 抓取问题

转载 作者:太空宇宙 更新时间:2023-11-04 00:51:51 25 4
gpt4 key购买 nike

试图从一个网站中提取数据,该网站在相同的标签名称下有几条不同的信息。例如:

<td class=pizza>cheese </td>
<td class=pizza> deluxe</td>
<td class=pizza> pepperoni</td>
<td class=pizza> raccoon</td>
<td class=pizza> mushshroom</td>
<td class=pizza> anchovy</td>

我如何编写一行网络抓取(使用 BeautifulSoup 4)来选择一个不会是奶酪的。 (说我想要豪华)。会不会是这样的:

pizza = soup.find("td", {"class": "pizza"})
print (pizza) #This will give me cheese as a result, and I want deluxe.

最佳答案

如果您不想要奶酪,您可以使用a function 过滤掉它。 :

soup.find("td", class_="pizza", text=lambda text: text and text.strip() != "cheese")

或者,如果您希望第二个 td 元素带有 class="pizza":

soup.find_all("td", class_="pizza")[1]

关于python - BeautifulSoup4 Python 3.4 抓取问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36783701/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com