gpt4 book ai didi

python - BR 内的文本无法使用 python beautifulsoup 获取

转载 作者:太空宇宙 更新时间:2023-11-03 21:02:39 25 4
gpt4 key购买 nike

我想获取 br 标签下 div 内的所有数据。但是它只获取第一个上的文本。

<div itemprop="description">

<p>Chars :
</br>- test1
</br>- test2
</br>- test3
</p>

</div>

脚本:

tag = soup.find(itemprop="description").get_text()

输出:

Chars
-test1

我想获取 br 内的所有文本

最佳答案

我的 lxml 和 select 没有遇到问题

from bs4 import BeautifulSoup as bs
html = '''
<div itemprop="description">

<p>Chars :
</br>- test1
</br>- test2
</br>- test3
</p>

</div>
'''
soup = bs(html, 'lxml')
data = [item.text.strip().replace('\n',' ') for item in soup.select('div[itemprop=description]')]
print(data)

关于python - BR 内的文本无法使用 python beautifulsoup 获取,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55628483/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com