python - 如何在python中使用beautifulsoup提取标签之间的文本-6ren

python - 如何在python中使用beautifulsoup提取标签之间的文本

转载作者：太空宇宙更新时间：2023-11-04 02:57:03

我正在尝试从以下 html 结构中提取文本:

<div class= "story-body story-content">
 <p>
  <br>
  "the text I want to get"
  <a href= "http://...>
  <br>
  "the text I want to get"
  <a href="http:// ... >
  .
  .

我已经提取了超链接，但我不知道如何提取文本。到目前为止我试过:

names = []
for div in soup3.find_all("div", attrs={"class" : "story-body story-content"}):
    for t in div.find_all('br'):
        t = t.get_text()
        names.append(t)

但我只得到:

[<br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, <br/>, u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'', u'']

最佳答案

for div in soup3.find_all("div", attrs={"class" : "story-body story-content"}):
    text_list = [text for text in div.stripped_strings]

使用stripped_string获取标签下的所有非空字符串

<br>标签插入一个换行符。它不包含任何文本。

关于python - 如何在python中使用beautifulsoup提取标签之间的文本，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/42051539/

文章推荐： python - 使用 Scoop 编程 DEAP

文章推荐： c - 如何开始使用 MSVC 运行

文章推荐： c - 如何使用按位运算返回 0？

太空宇宙

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - 如何在python中使用beautifulsoup提取标签之间的文本