- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试从以下 html 结构中提取文本:
<div class="account-places">
<div>
<ul class="location-history">
<li></li>
<li>Text to extract</li>
</ul>
</div>
</div>
from bs4 import BeautifulSoup as bs
soup = bs(html, "lxml")
div = soup.find("div", {"class": "account-places"})
text = div.div.ul.li.next_sibling.get_text()
最佳答案
看来您需要 find_next_sibling("li")
.
例如:
from bs4 import BeautifulSoup as bs
soup = bs(html, "lxml")
div = soup.find("div", {"class": "account-places"})
text = div.div.ul.li.find_next_sibling("li").get_text()
print(text)
Text to extract
关于Python Beautiful Soup 'NavigableString' 对象没有属性 'get_text',我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50705372/
我有点困惑:所有标签都有一个 decompose() 方法,该方法允许从树中就地删除标签。但是如果我想删除 NavigableString 该怎么办?它没有这样的方法: >>> b = Beautif
这可能看起来很简单,但我无法让它发挥作用。最近刚开始学习scraping,也遇到了这个问题。尝试了 python REPL 中的代码,它似乎可以工作,但是不确定为什么当我编码它时,它无法工作。 这是我
这个问题已经有答案了: Why do I get a recursion error with BeautifulSoup and IDLE? (1 个回答) 已关闭 8 年前。 我正在使用 Beau
我有一个 HTML 页面,其树的一部分看起来像这样(请参阅下面包含 html 的代码片段): | |
我正在尝试从以下 html 结构中提取文本: Text to extract 我有以下 B
这是我的代码: soup_detail.find_all("script",type="application/ld+json")[0].contents[0] 这是上面代码的输出: '{ "@con
当我运行以下代码时: 如果 substr in movie.lowercase: 出现以下错误 AttributeError: 'NavigableString' 对象没有 'lowercase' 属
你知道为什么 BeautifulSoup 教程中的第一个例子 http://www.crummy.com/software/BeautifulSoup/documentation.html#Quick
尝试让此脚本迭代 html 文件并打印出所需的结果。它一直给我这个错误。当表中只有一场“游戏”时,它可以正常工作,但如果有多个“游戏”,它就会崩溃。尝试修复它,以便它可以迭代多个游戏/ parking
我在 BeautifulSoup (python) 中遇到一些 navigablestrings 和 unicode 问题。 基本上,我正在解析来自 youtube 的四个结果页面,并将顶部结果的扩展
我需要将 bs4.element.NavigableString (来自 beautiful soup: http://www.crummy.com/software/BeautifulSoup/bs
import requests from bs4 import BeautifulSoup url=("http://finance.naver.com/news/mainnews.nhn") r=r
我想从以下页面中使用 class="academicsList" 抓取 ul 中每个 li 的文本: https://www.eduvision.edu.pk/institutions-detail.
我是 Python 的新手(我只知道 powershell),我正在尝试使用 BS4+Python3 学习网络爬虫。 这是我练习的一个简单练习: test1 test2 我想做的是仅获取具有属性“
如何使用 Beautiful Soup API 来检查从同一 BeautifulSoup 对象检索的两个 Tag 或 NavigableString 对象是否确实是 DOM 中的同一对象? 例如,下面
我正在尝试抓取维基百科文章中的表格,每个表格元素的类型似乎都是 和 . import requests import bs4 import lxml resp = requests.get('htt
我是一名优秀的程序员,十分优秀!