gpt4 book ai didi

html - 如何使用 BeautifulSoup 获取特定元素后的所有文本?

转载 作者:行者123 更新时间:2023-12-04 14:56:09 26 4
gpt4 key购买 nike

我有以下 HTML(已截断):

<p>
Quant à Madame O., si elle a retrouvé un emploi depuis juin 2016 lui permettant de percevoir un salaire mensuel net de 1.780,50 euros (pièce 38 de l'intimée)...
</p>
<div class="faits">
<p>
Sur la résidence habituelle des enfants communs et les droits de visite et d'hébergement
</p>
</div>
<p>
Les mesures d'investigation réalisées, aussi bien l'enquête sociale que l'expertise psychologique familiale…
<div class="motifs">
La Cour observe en outre que le juge des enfants de Toulon, dans sa dernière décision en date du 31 octobre 2016 (pièce 85 de l'appelant) a ordonné, en l'absence de situation de danger, un non lieu à assistance éducative.
</div>
<div class="motifs">
Il est confirmé dans ce jugement que les enfants sont décrits comme spontanés, complices...
</div>
</p>
<p>
Par ailleurs il convient de maintenir le lien entre les enfants et leur père mais aussi d'adapter le droit de visite et d'hébergement de Monsieur Z. aux contraintes résultant de l'éloignement géographique entre les domiciles parentaux. La décision du premier juge sera donc confirmée sauf à préciser, par dispositions nouvelles, les points suivants :…
</p>

在文档中我有几个<div class="motifs">目标是获取最后一个 <div class="motifs"> 之后的所有文本.换句话说,我想获取从“Par ailleurs il convient...”开始直到结束的所有文本。

我找到了最后一个 <div class="motifs">这样:

last_marked = soup.find_all('div', {'class': 'motifs'})[-1]

我从 last_marked 得到了正确的输出.但是我怎样才能得到 last_marked 之后出现在 HTML 中的所有文本? ?

最佳答案

有一个恰好的方法,要在特定元素之后找到所有标签,使用find_all_next() :

These methods use .next_elements to iterate over whatever tags and strings that comeafter it in the document.

soup = BeautifulSoup(html, "html.parser")
last_marked = soup.find_all('div', {'class': 'motifs'})[-1]

for tag in last_marked.find_all_next("p"):
print(tag)

关于html - 如何使用 BeautifulSoup 获取特定元素后的所有文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67938815/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com