gpt4 book ai didi

python - 剥离 Html 标签 Findall + Beautiful Soup

转载 作者:太空宇宙 更新时间:2023-11-03 14:55:45 25 4
gpt4 key购买 nike

好吧,我已经搜索了大约 2 个小时,我相信我的大脑可能已经烧坏了。今天是我使用 BeautifulSoup 的第一天(所以请温柔一些)。我正在抓取的网站的源代码的格式如下:

<a href="/listing/view" class="price">$100</a>

我觉得很愚蠢,因为我在写入文件时得到了整个 a 标签,并且我偷偷怀疑有一个如此简单的解决方案,但我似乎找不到它。

目前我正在使用以下内容:

soup = BeautifulSoup(page.content, 'html.parser')
prices = soup.find_all(class_="price")
passed.append(prices)

如何才能仅定位特定标签之间具有匹配类的内容?

最佳答案

prices = soup.find_all(class_="price")

for a in prices:
passed.append(int(a.text.strip().replace('$','')) # will append to the list

这应该有帮助。

关于python - 剥离 Html 标签 Findall + Beautiful Soup,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45598443/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com