gpt4 book ai didi

python - 如何通过类python中的特定子字符串查找带有类字符串的span

转载 作者:行者123 更新时间:2023-12-01 06:56:06 24 4
gpt4 key购买 nike

我正在使用 Beautifulsoup 下载一些数据。我提取代码,看起来像这样。

<td><span class="calendar-date-2">11:50 PM </span></td>,
<tr><td>
<div title="ABC"></div>
</td></tr>
<span>SEP</span>

<td><span class="calendar-date-1">12:00 PM </span></td>,
<tr><td>
<div title="CDE"></div>
</td></tr>
<span>OCT</span>

<td><span class="calendar-date-3">12:10 PM </span></td>,
<tr><td>
<div title="FGH"></div>
</td></tr>
<span>NOV</span>

我需要将{时间,标题,月份}放入一个df中。这需要通过类 attr 中的子字符串“calendar-date”进行选择。

我想使用

bs4.find_all('span',{class: XXX})

但这要求类具有确切的属性。

我不知道如何编写代码。

最佳答案

尝试不使用正则表达式的 CSS 选择器。

from bs4 import BeautifulSoup

datahtml = """<td><span class="calendar-date-2">11:50 PM </span></td>,
<tr><td>
<div title="ABC"></div>
</td></tr>
<span>SEP</span>

<td><span class="calendar-date-1">12:00 PM </span></td>,
<tr><td>
<div title="CDE"></div>
</td></tr>
<span>OCT</span>

<td><span class="calendar-date-3">12:10 PM </span></td>,
<tr><td>
<div title="FGH"></div>
</td></tr>
<span>NOV</span>"""

soup = BeautifulSoup(datahtml, "html.parser")
for span in soup.select("[class^='calendar-date-']"):
print(span.text)
print(span.find_previous('td').find_next('div')['title'])
print(span.find_next('span').text)

关于python - 如何通过类python中的特定子字符串查找带有类字符串的span,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58799507/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com