gpt4 book ai didi

html - 如何使用 XPath 获取 header 中的内容

转载 作者:行者123 更新时间:2023-11-28 01:53:16 26 4
gpt4 key购买 nike

我正在使用 Yahoo Pipes 从网页中提取内容。出于某种原因,开发者将文章内容放在了<h2>内。标签,我很难从那里获取内容。

内容是这样的:

<div id="divid"><h2>
<p>Some content<p>
<p>Some more content</p>
</h2>
<!-- some more stuff here -->
</div>

当我使用 //div[@id='divid'] 时我可以获取整个 <div> 的内容 block ,但是当我尝试 //div[@id='divid']//h2//div[@id='divid']//h2/text()我一无所获。

我做错了什么以及如何获取 <h2> 之间的内容标签正确吗?

您可能需要检查实际的 web page .

最佳答案

也许您缺少的是勾选使用 HTML5 解析器 选项。否则它无法匹配 //h2 .

该页面非常出色。文满<span...>带有内联样式的标签。我创建了一个示例管道来使页面有意义:

http://pipes.yahoo.com/pipes/pipe.info?_id=cf46006f77bdac4a6e57785c78cd0b2b

关于html - 如何使用 XPath 获取 header 中的内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18787315/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com