gpt4 book ai didi

python-2.7 - 如何使用 BeautifulSoup 从 Python 中的字符串中删除 html 标签

转载 作者:行者123 更新时间:2023-12-03 18:42:03 25 4
gpt4 key购买 nike

这里是编程新手:)

我想使用 BeautifulSoup 从网站上打印价格。这是我的代码:

#!/usr/bin/env python
# -*- coding: utf-8 -*-


from bs4 import BeautifulSoup, SoupStrainer
from urllib2 import urlopen

url = "Some retailer's url"
html = urlopen(url).read()
product = SoupStrainer('span',{'style': 'color:red;'})
soup = BeautifulSoup(html, parse_only=product)
print soup.prettify()

并按以下顺序打印价格:

<span style="color:red;">
180
</span>
<span style="color:red;">
1250
</span>
<span style="color:red;">
380
</span>

我尝试了 print soup.text.strip() 但它返回了 1801250380

请帮我打印每行的价格:)

非常感谢!

最佳答案

>>> print "\n".join([p.get_text(strip=True) for p in soup.find_all(product)])
180
1250
380

关于python-2.7 - 如何使用 BeautifulSoup 从 Python 中的字符串中删除 html 标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22313981/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com