gpt4 book ai didi

html - XPath 和 XQuery 可以处理 HTML 文档吗?

转载 作者:数据小太阳 更新时间:2023-10-29 02:00:04 25 4
gpt4 key购买 nike

我从https://stackoverflow.com/a/39560454听说HTML文档不是XML文档.

XPath 和 XQuery 处理 XML 文档。他们可以处理 HTML 文档吗?为什么?

虽然我不知道为什么,我猜 XPath 可以在 HTML 文档上工作,因为 https://www.quora.com/Why-do-we-use-XPath-in-Selenium-even-though-CSS-Selector-is-fasterhttps://html-agility-pack.net/

最佳答案

XQuery 和 XPath 被定义为在称为 XDM 的特定数据模型上工作。在 XPath 1.0 中,这在 XPath 规范中进行了描述;在 XQuery 和后来的 XPath 版本中,它是在单独的规范中定义的。 XPath 和 XQuery 可以处理定义了 XDM 映射的任何数据。 XML 和 HTML DOM 在许多细节上都与 XDM 不同,但是可以(有一点实用主义)定义到 XDM 的映射,因此可以使 XPath 针对 XML 和 HTML DOM 运行。事实上,这两种映射都得到了非常广泛的使用,尽管它们并不完美并且在某些情况下效率低下。

HTML 映射到 XDM 的最大问题是 namespace ; XPath 实现传统上认为“table”和“p”等 HTML 元素不在 namespace 中,因此可以使用 //table//p 等路径,而无需 namespace 前缀。但在 HTML5 中,WhatWG 决定这些元素位于 XHTML namespace 中,这意味着他们必须定义 XPath 规范的变体以适应此类路径。

CSS 选择器已经慢慢获得了 XPath 1.0 的大部分表达能力,尽管它们肯定不如后来的版本那么丰富,并且由于它们主要是为 HTML 而不是 XML 设计的,因此有时使用起来更方便。我还没有看到任何性能数据,但是浏览器供应商不得不付出很多努力来使 CSS 变快,而且在过去的 15 年中,他们似乎在 XPath 实现上几乎没有进行任何开发,所以它肯定不会'如果 CSS 在大多数浏览器中更快,我不会感到惊讶。 DOM 和 XDM 之间的差异也会产生开销:特别是 DOM 中命名空间的非常低效的表示。

关于html - XPath 和 XQuery 可以处理 HTML 文档吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55820147/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com