gpt4 book ai didi

html - 使用 Beautifulsoup 提取下一个和不同标签的内容

转载 作者:行者123 更新时间:2023-12-04 18:44:21 29 4
gpt4 key购买 nike

我想 抓取 一些特定的 html 代码。
我的python代码:

    soup = '''

<p>
<strong> abc </strong>
</p>

<ul>
<li> 123 </li>
<li> 456 </li>
</ul>
'''

import bs4
soup = bs4.BeautifulSoup(soup, 'html.parser')
for link in soup.find_all('strong') :
k = link.next_sibling
print (link.text)
print (k)
print (k.text)
和输出:
    abc

AttributeError: 'NavigableString' object has no attribute 'text'
如何使用上述标签提取“123”和“456”?
谢谢 。

最佳答案

解决方案有很多,例如可以结合 find_next()find_next_sibling() 方法:

soup = '''

<p>
<strong> abc </strong>
</p>

<ul>
<li> 123 </li>
<li> 456 </li>
</ul>
'''

import bs4
soup = bs4.BeautifulSoup(soup, 'html.parser')
for link in soup.find_all('strong') :
li1 = link.find_next().li
li2 = li1.find_next_sibling()
print(link.text)
print(li1.text)
print(li2.text)

打印:
 abc 
123
456

关于html - 使用 Beautifulsoup 提取下一个和不同标签的内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59480846/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com