gpt4 book ai didi

r - 使用带有 xml2 的管道运算符编写 XML

转载 作者:行者123 更新时间:2023-12-04 09:36:04 24 4
gpt4 key购买 nike

xml2 包允许用户创建 XML 文档。我正在尝试使用管道运算符 %>% 创建文档添加子节点和兄弟节点的各种组合。我无法弄清楚如何在原始 child 的 sibling 之后的子节点中创建子节点(请参见下面的示例)。

是否可以“上升”一个级别然后创建更多节点,还是必须在链式命令之外创建它们?

我要什么

library(xml2)
x1 <- read_xml("<parent><child>1</child><child><grandchild>2</grandchild></child><child>3</child><child>4</child></parent>")
message(x1)
#> <?xml version="1.0" encoding="UTF-8"?>
#> <parent>
#> <child>1</child>
#> <child>
#> <grandchild>2</grandchild>
#> </child>
#> <child>3</child>
#> <child>4</child>
#> </parent>

我正在创造的东西是错误的
library(magrittr)
library(xml2)
x2 <- xml_new_document()
x2 %>%
xml_add_child("parent") %>%
xml_add_child("child", 1) %>%
xml_add_sibling("child", 4, .where="after") %>%
xml_add_sibling("child", 3) %>%
xml_add_sibling("child", .where="before") %>%
xml_add_child("grandchild", 2)
message(x2)
#> <?xml version="1.0" encoding="UTF-8"?>
#> <parent>
#> <child>1</child>
#> <child>4</child>
#> <child>
#> <grandchild>2</grandchild>
#> </child>
#> <child>3</child>
#> </parent>

使用 XML 包的解决方案

如果使用 完成,这实际上相当简单。 XML 包裹。
library(XML)
x2 <- newXMLNode("parent")
invisible(newXMLNode("child", 1, parent=x2))
invisible(newXMLNode("child", newXMLNode("grandchild", 2), parent=x2))
invisible(newXMLNode("child", 3, parent=x2))
invisible(newXMLNode("child", 4, parent=x2))
x2
#> <?xml version="1.0" encoding="UTF-8"?>
#> <parent>
#> <child>1</child>
#> <child>
#> <grandchild>2</grandchild>
#> </child>
#> <child>3</child>
#> <child>4</child>
#> </parent>

最佳答案

我首先要说的是,我认为这通常是个坏主意。 xml2 使用指针工作,这意味着它具有引用语义(“通过引用传递”),这不是 R 中的典型行为。 xml2 中的函数通过对 XML 树产生副作用来工作,而不是像函数式编程那样返回值(“按值传递”)。

这意味着管道基本上是错误的原理。您只需要按正确顺序修改对象的一系列步骤。

也就是说,你可以这样做:

library("magrittr")
library("xml2")
x2 <- xml_new_document()
x2 %>%
xml_add_child(., "parent") %>%
{
xml_add_child(., "child", 1, .where = "after")
(xml_add_child(., "child") %>% xml_add_child("grandchild", 2))
xml_add_child(., "child", 3, .where = "after")
xml_add_child(., "child", 4, .where = "after")
}
message(x2)
## <?xml version="1.0" encoding="UTF-8"?>
## <parent>
## <child>1</child>
## <child>
## <grandchild>2</grandchild>
## </child>
## <child>3</child>
## <child>4</child>
## </parent>
.告诉 %>%在对 xml_add_child() 的后续调用中放置“父”节点的位置. ()中间的带括号的表达式利用了这样一个事实,即您要通过管道传输到“子”节点,然后将该子节点通过管道传输到孙节点。

另一种选择,如果你真的想在整个过程中使用管道是使用 %T>%管道,而不是 %>%管道(或者更确切地说,是两者的混合)。两者的区别如下:
> 1:3 %>% mean() %>% str()
num 2
> 1:3 %T>% mean() %>% str()
int [1:3] 1 2 3
%T>%管道将左侧表达式的值插入右侧表达式,但进一步将其插入后续表达式。这意味着您可以在管道中间调用函数以获得副作用,并继续在管道中向前传递较早的对象引用。

当您说“提升一个级别”时,这就是您要尝试做的事情 - 即,备份到管道中的先前值并从那里开始工作。所以你只需要 %T>%管道,直到到达您想要的点 %>%管道(例如,创建孙子)然后返回到 %T>%管道继续向前携带父对象引用。一个例子:
x3 <- xml_new_document()
x3 %>%
xml_add_child("parent") %T>%
xml_add_child("child", 1, .where = "after") %T>%
{xml_add_child(., "child") %>% xml_add_child("grandchild", 2)} %T>%
xml_add_child("child", 3, .where = "after") %>%
xml_add_child("child", 4, .where = "after")
message(x3)
## <?xml version="1.0" encoding="UTF-8"?>
## <parent>
## <child>1</child>
## <child>
## <grandchild>2</grandchild>
## </child>
## <child>3</child>
## <child>4</child>
## </parent>

注意最后的 %>%而不是 %T>% .如果您交换了 %>%%T>%整个管道的值将仅为“父”节点树:
{xml_document}
<parent>
[1] <child>1</child>
[2] <child>\n <grandchild>2</grandchild>\n</child>
[3] <child>3</child>
[4] <child>4</child>

(这 - 再次 - 最终并不重要,因为我们实际上是在使用副作用构建 x3,但它会将父节点树打印到控制台,这可能会令人困惑。)

再次,鉴于尴尬,我建议根本不要使用管道,但这取决于您。更好的方法是保留要附加子项的每个对象,然后每次再次引用它。和第一个例子一样,将父节点保存为 p ,跳过所有管道,只需引用 p到处都是 .在示例代码中使用。

关于r - 使用带有 xml2 的管道运算符编写 XML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51753718/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com