python-3.x - 使用 XPath，选择没有文本兄弟的节点-6ren

python-3.x - 使用 XPath，选择没有文本兄弟的节点

转载作者：行者123 更新时间：2023-12-03 16:08:46

24

4

我想用python3和lxml提供的HTML解析器提取一些HTML元素。

考虑这个 HTML:

<!DOCTYPE html>
<html>
  <body>
    <span class="foo">
      <span class="bar">bar</span>
      foo
    </span>
  </body>
</html>

考虑这个程序:

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
from lxml import html
tree = html.fromstring('html from above')
bars = tree.xpath("//span[@class='bar']")
print(bars)
print(html.tostring(bars[0], encoding="unicode"))

在浏览器中，查询选择器“span.bar”仅选择 span 元素。这就是我所渴望的。但是，上述程序会产生:

[<Element span at 0x7f5dd89a4048>]
<span class="bar">bar</span>foo

看起来我的 XPath 实际上并不像查询选择器，并且在 span 元素旁边拾取同级文本节点。如何调整 XPath 以仅选择 bar 元素，而不选择文本“foo”？

最佳答案

注意 lxml 中的 XML 树模型(以及在标准模块 xml.etree 中)具有 tail 的概念.所以位于 a.k.a following-sibling 之后的文本节点元素的数量将存储为 tail那个元素。所以你的 XPath 正确返回 span元素，但根据树模型，它有 tail其中包含文本'foo'。

作为一种解决方法，假设您不想进一步使用树模型，只需清除 tail打印前:

>>> bars[0].tail = ''
>>> print(html.tostring(bars[0], encoding="unicode"))
<span class="bar">bar</span>

关于python-3.x - 使用 XPath，选择没有文本兄弟的节点，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/48990592/

24

4

0

文章推荐： r - 从XML提取数据并传递到data.frame(使用NA表示丢失)

文章推荐： cocoa - PyObjC 和自定义 block

文章推荐： cocoa - 获取 NSImageView 上实际显示图像的大小

文章推荐： selenium - 在运行时将值传递给 xpath

security - 兄弟:只记录一个流
我的目标是运行类似 bro --iface 的命令并只获取 conn.log，但我无法从 Bro 文档或联机帮助页中得知如何执行此操作。谢谢。最佳答案这让你继续: bro -i -b b
jQuery 在父/兄弟/子上移除Class
我正在使用以下 jQuery 来更改无序列表中元素的类。这似乎不是实现该效果的最有效方法。有更好的写法吗？ $(function() { $('nav li a').click( functi
css - 如何选择其他(兄弟)元素CSS？
我有一个看起来像这样的导航栏 Services Work Contact 当我 :hover 一项时，我想更改其他两项的样式。我可以使用什么 CSS 选择器？最佳答案您
javascript - jQuery 兄弟/子选择器
我正在寻找一种方法来选择包含特定图像的列的行内具有特定名称属性的所有输入。下面的代码是一个说明性示例:
css - 如何引用 SCSS 兄弟？
假设我有以下 HTML: 我想在鼠标悬停在元素上时对图标应用一些规则，可以用以下 CSS 描述: .navigation__item__icon { color: black; } .n
jquery - 兄弟 div 没有接受最高命令
我的 div text-button 没有与我在其兄弟 div 下想要的正确边距对齐。我将 position: absolute; 设置到位，因为每次我将其设置为相对位置时，jQuery 动画都不起作
html - 兄弟 div 的上边距不是从同一点开始的
这个问题在这里已经有了答案: CSS margin terror; Margin adds space outside parent element [duplicate] (7 个答案) 关闭
ios - 兄弟 NSManagedObjectContext 如何交互？
如果我有 3 个 NSManagedObjectContext。一个。是根上下文。 B.是一个后台保存上下文，解析一个JSON后生成NSManagedObjects C.是在 NSFetchedRe
css - 兄弟 div 匹配容器中的高度
我在容器中有三个 div:http://jsfiddle.net/fBe9y/ 一个div内容很多。如何让内容较少的其他两个 div 与最长的 div 的高度匹配？我尝试将 height: 100%
javascript - 单击同一级别的元素(兄弟？)切换类，但不要切换具有相同类的其他元素
我正在尝试通过单击另一个元素对一个元素执行一个简单的 toggleClass。有多个元素具有相同的类，我只想切换同级/最近的元素。我相信我从根本上理解了针对 parent / child / sibl
javascript - 兄弟 Controller 可以在没有父级帮助的情况下相互通信吗 - AngularJS
我正在使用 AngularJS 开发一个小应用程序。我的项目包含一个包含 3 个 View 的 Body.html 文件:SideMenu、Header 和 Content，每个 View 都有自己的
html - 兄弟 float div 延伸相同的垂直距离
在 CSS 方面，我不认为我是个笨蛋，但这个就是我。我的想法是我需要一个父元素，两侧有两个 float 子元素。我希望 parent 的高度与 child 的高度一样高，并让 child 的高度变得相
css - 兄弟 span(s) 相对于彼此的定位
我有两个 span(s) 在父级 div 中彼此相邻。我希望第二个 span 显示在最左边，然后是第一个 span。 (注意:由于某些原因，我不能简单地移动第二个跨度来代
Python selenium 父子、兄弟、相邻节点定位方式详解
今天跟大家分享下selenium中根据父子、兄弟、相邻节点定位的方法，很多人在实际应用中会遇到想定位的节点无法直接定位，需要通过附近节点来相对定位的问题，但从父节点定位子节点容易，从子节点定位父节点
javascript - 兄弟 div 上的 removeClass 不起作用
这是 HTML 的结构:
html - 兄弟 div 在没有 Flexbox 的情况下填充包装器内的垂直空间
我在一个包装器中并排放置了两个 div。其中一个 div 的内容比另一个多，我希望第二个 div 填充包装的垂直空间。 .wrapper { height: 50%; width: 50%;
html - 兄弟 div 在其他兄弟 div 的内部
我的网站顶部有一个带有此 CSS 的菜单: .menu { width: 100%; display: block; float: left; } 在里面，我有几个 div: .menu .menu-
javascript - 为什么我不能使用纯 JavaScript 选择下一个 DIV 兄弟？
我有两个 div 元素，第一个 div 中有一个按钮，如下所示。 Click 下面是我的 JavaScript 代码。 function nextDiv(el
html - 兄弟 div 从位置为 :static 的文本中拆分背景
两个同级 div(#one 和 #two)，每个都包含一些文本。我移动#two margin-top 为负，预计它会覆盖 #one , 但当文本位于 #one 前面时，背景位于下方。只有在 #on
html - 100% 高度
基于 float 兄弟
我有一个容器 div，它有一个 float 的左侧导航 Pane 和一个右侧的内容 Pane : CSS: body { text-align: cent

首页

博学

6Ren·AI

商城

python-3.x - 使用 XPath，选择没有文本兄弟的节点