gpt4 book ai didi

r - 从 XML 包中保存 htmlParse 对象

转载 作者:行者123 更新时间:2023-12-01 11:49:44 25 4
gpt4 key购买 nike

我想保存作为 htmlParse 命令结果的对象。这是一些代码来说明我的问题。简单地说,我希望能够将解析后的 H​​TML 页面保存到一个对象中,并将其加载到 future 的 session 中。

library(XML)
PATH = "/colleges/Bentley-University"
URL <- paste("http://www.cappex.com", PATH, sep="")
doc <- htmlParse(URL)
mylist <- list(doc)
mylist[[1]]
save(mylist, file="mylist.Rdata")
rm(list=ls())
load("mylist.Rdata")

但是,当我试图记忆我的列表的内容时,这是我得到的错误:

> mylist[[1]]
Error in file(con, "r") : cannot open the connection
In addition: Warning message:
In file(con, "r") :
cannot open file '/var/folders/hv/wtvckymn0230hpsdwylmtf0r0000gn/T//Rtmp8Mrpev/fileed256550e50': No such file or directory

最佳答案

doc 无法保存,因为它是指向“C 级节点”的指针。把它放在一个列表中并不能改变这个事实。您可以先将 XML 树的表示形式写入字符串,然后保存。在你可以恢复文本之后。

library(XML)
PATH = "/colleges/Bentley-University"
URL <- paste("http://www.cappex.com", PATH, sep="")
doc <- htmlParse(URL)
saveXML(doc, file="ex.txt")
rm(list=ls())

# recover
doc<-htmlParse('ex.txt')

关于r - 从 XML 包中保存 htmlParse 对象,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12487682/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com