gpt4 book ai didi

r - 从 xml 节点集中提取文本

转载 作者:数据小太阳 更新时间:2023-10-29 03:00:36 25 4
gpt4 key购买 nike

我正在从网页中提取日期,但很难提取文本

date_ <- html_nodes(page_, xpath = '//*[@id="particular_con"]/div[2]/text()')
## prints ##
# {xml_nodeset (1)}
# [1] 2017-03-27

我尝试添加 ``[[(1L)date_[[1]]但这会打印

{xml_node}
<text>

我只想提取2017-03-27

最佳答案

只需使用html_text

正如函数名称所示,html_nodes 返回指向节点的有点指针。要从它们中提取信息,请使用 html_texthtml_attr

将第一行更改为:

date_ <- html_nodes(page_, xpath = '//*[@id="particular_con"]/div[2]/text()') %>% html_text()

关于r - 从 xml 节点集中提取文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43207454/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com