gpt4 book ai didi

python - BeautifulSoup 4、findNext()函数

转载 作者:太空狗 更新时间:2023-10-30 00:41:16 24 4
gpt4 key购买 nike

我正在玩 BeautifulSoup 4,我有这个 html 代码:

</tr>
<tr>
<td id="freistoesse">Giraffe</td>
<td>14</td>
<td>7</td>
</tr>

我想匹配 <td> 之间的两个值在这里标记 14 和 7。

我试过这个:

giraffe = soup.find(text='Giraffe').findNext('td').text

但这只匹配 14 .如何将这两个值与此函数匹配?

最佳答案

使用 find_all 而不是 findNext:

import bs4 as bs
content = '''\
<tr>
<td id="freistoesse">Giraffe</td>
<td>14</td>
<td>7</td>
</tr>'''
soup = bs.BeautifulSoup(content)

for td in soup.find('td', text='Giraffe').parent.find_all('td'):
print(td.text)

产量

Giraffe
14
7

或者,您可以使用 find_next_siblings(也称为 fetchNextSiblings):

for td in soup.find(text='Giraffe').parent.find_next_siblings():
print(td.text)

产量

14
7

解释:

请注意,soup.find(text='Giraffe') 返回一个 NavigableString。

In [30]: soup.find(text='Giraffe')
Out[30]: u'Giraffe'

要获取关联的 td 标签,请使用

In [31]: soup.find('td', text='Giraffe')
Out[31]: <td id="freistoesse">Giraffe</td>

In [32]: soup.find(text='Giraffe').parent
Out[32]: <td id="freistoesse">Giraffe</td>

一旦有了 td 标签,就可以使用 find_next_siblings:

In [35]: soup.find(text='Giraffe').parent.find_next_siblings()
Out[35]: [<td>14</td>, <td>7</td>]

附言。 BeautifulSoup 添加了使用下划线而不是 CamelCase 的方法名称。他们做同样的事情,但符合 PEP8 风格指南的建议。因此,首选 find_next_siblings 而不是 fetchNextSiblings

关于python - BeautifulSoup 4、findNext()函数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15771424/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com