gpt4 book ai didi

Rvest:获取节点文本而不是其子文本

转载 作者:行者123 更新时间:2023-12-02 09:23:53 27 4
gpt4 key购买 nike

html_text() 方法(来自 R Package rvest)连接节点的文本和它的所有子节点。我想提取仅父亲的文本

对于以下示例,html_text() 给出HELLO GOODBYE

我只想GOODBYE。我怎样才能得到它?

<div class="joke">
<div class="div_inside">
<div class="title_inside">
<a class="link" href="sompage.htm">HELLO</a>
</div>
</div>
GOODBYE
</div>

最佳答案

尝试使用 xpath 获取带有 class“joke”的主 div 标签,而不获取其子标签:

library(rvest)

read_html('your_html_script') %>%
html_nodes(xpath = '//div[@class="joke"]/node()[not(self::div)]') %>%
html_text()

谢谢!

关于Rvest:获取节点文本而不是其子文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39506292/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com