gpt4 book ai didi

python - 从 html 文件的元素中提取信息

转载 作者:太空宇宙 更新时间:2023-11-04 10:32:14 25 4
gpt4 key购买 nike

我想从以下字符串中提取 402。我用的是美汤。

<span class="bla bla bla"> <span class="ba1 ba1">  </span>402.00</span>

我尝试使用 strip() 但元素 bs4.element.resultset 不允许这样做。

请建议我该怎么做??

不胜感激

最佳答案

找到内部跨度并得到 next_sibling :

soup.find('span', class_='bla').find('span', class_='ba1').next_sibling

演示:

>>> from bs4 import BeautifulSoup
>>> data = '<span class="bla bla bla"> <span class="ba1 ba1"> </span>402.00</span>'
>>> soup = BeautifulSoup(data)
>>> soup.find('span', class_='bla').find('span', class_='ba1').next_sibling
u'402.00'

关于python - 从 html 文件的元素中提取信息,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25745720/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com