gpt4 book ai didi

python - 如何使用 BeautifulSoup 获取 child 标签的描述文本

转载 作者:行者123 更新时间:2023-12-01 03:43:54 25 4
gpt4 key购买 nike

我正在使用 beautiful soup 来抓取一些数据 foodily.com

在上面的页面上有一个带有“ings”类的 div ,我想在其 p 标签内获取数据,我已在下面编写了代码:

ingredients = soup.find('div', {"class": "ings"}).findChildren('p')

它为我提供了成分列表,但带有 p 标签。

最佳答案

调用get_text()对于在带有 class="ings"div 元素内找到的每个 p 元素。

完整的工作代码:

from bs4 import BeautifulSoup
import requests

with requests.Session() as session:
session.headers.update({"User-Agent": "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.2743.82 Safari/537.36"})
response = session.get("http://www.foodily.com/r/0y1ygzt3zf-perfect-vanilla-cupcakes-by-annie-s")

soup = BeautifulSoup(response.content, "html.parser")

ingredients = [ingredient.get_text() for ingredient in soup.select('div.ings p')]
print(ingredients)

打印:

[
u'For the cupcakes:',
u'1 stick (113g) butter/marg*',
u'1 cup caster sugar', u'2 eggs',
...
u'1 tbsp vanilla extract',
u'2-3tbsp milk',
u'Sprinkles to decorate, optional'
]

请注意,我还稍微改进了您的定位器并切换到 div.ings p CSS selector .

关于python - 如何使用 BeautifulSoup 获取 child 标签的描述文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39229110/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com