gpt4 book ai didi

r - R Xpath用于避免特定祖先。

转载 作者:行者123 更新时间:2023-12-03 17:32:03 34 4
gpt4 key购买 nike

我正在R中进行工作,以分析网络的复杂结构,我想提取字体标签中包含的信息,但是碰巧表中的数据也位于字体标签之间。

XPath示例:

text/div/font
table/tbody/tr/td/div/font


由于结构非常复杂,我无法预测确切的Xpath,因此我使用// font作为xpath来提取相关数据,但是由于表中的信息也包含在标签font中,所以我得到的信息不是与我的分析有关。

xpathCodefont <- "//font"
htmlCodeFonts <- xpathSApply(htmlCode,xpathCodefont,xmlValue)


有什么语法可以让我“跳过”带有表路径的字体?换句话说,我该如何避免以表为祖先的字体(而不是作为直接父级的字体)。

提前致谢,

最佳答案

包含一个reproducible example本来很好,所以我们可以测试可能的解决方案,但是我认为您想要

xpathCodefont <- "//font[not(ancestor::table)]"


那应该返回不在表内的所有字体标签。

关于r - R Xpath用于避免特定祖先。,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33157117/

34 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com