gpt4 book ai didi

python - 如何在 BeautifulSoup 中找到 `td` 父标签的所有 `tr` 且具有 `class="Accordion-toggle main-row"' 的父标签?

转载 作者:太空宇宙 更新时间:2023-11-03 14:26:53 26 4
gpt4 key购买 nike

我有多个具有不同classtr标签,如下所示:

<tr class="accordion-toggle main-row" data-parent="#OrderPackages" data-target=".packageDetails1" data-toggle="collapse" id="package1">
<td><p>01629046</p></td><td><p><a href="https://www.zaubacorp.com/director/SHARMISTHA-HANSRAJ-KAJARIA/01629046"> SHARMISTHA HANSRAJ KAJARIA</a></p>
</td><td><p>Director</p></td>
<td><p>01 November 2012</p></td>
<td><p><a href="javascript:">View other directorships</a></p></td></tr>

如果 tr 父标记具有 class="accordion-toggle main-row",我想提取 td.p 的所有文本。

<tr class="row text-good" data-parent="#OrderPackages" data-
target=".packageDetails1" data-toggle="collapse" id="package1">
<td><p>01629046</p></td><td><p><a
href="https://www.zaubacorp.com/director/SHARMISTHA-HANSRAJ-KAJARIA/01629046"> SHARMISTHA HANSRAJ KAJARIA</a></p>
</td><td><p>Director</p></td>
<td><p>01 November 2012</p></td>
<td><p><a href="javascript:">View other directorships</a></p></td></tr>

更新:这里两个类依次相互依赖 - 就像从第二类获取信息并附加到使用第一类收到的信息作为字典

最佳答案

试试这个:

soup = bs.BeautifulSoup(html, 'html.parser')

trs = soup.find_all('tr', attrs={'class' : 'accordion-toggle main-row'})
trs.append(soup.find_all('tr', attrs={'class' : 'row text-good'}))

for tr in trs:
tds = tr.find_all('td')
for td in tds:
print(td.p.text)
<小时/>

迭代期间检查tr类的条件:

if(' '.join(tr.get('class') == 'YOUR_CLASS'):
#Do something

tag.get() 返回列表而不是字符串,因此您必须加入单独的类。

关于python - 如何在 BeautifulSoup 中找到 `td` 父标签的所有 `tr` 且具有 `class="Accordion-toggle main-row"' 的父标签?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47569935/

26 4 0