- xml - AJAX/Jquery XML 解析
- 具有多重继承的 XML 模式
- .net - 枚举序列化 Json 与 XML
- XML 简单类型、简单内容、复杂类型、复杂内容
我必须从 SAS 数据集生成一个 XML 文件。 XML文件的格式定义非常严格,我需要准确匹配。我正在使用 SAS 9.4(注意:并坚持使用它!)并利用 XMLMAP 和 libname xmlv2。我觉得我非常接近解决方案,但还有最后一个障碍我似乎无法通过!
XML 文件有一个 3 级结构,一个 2 级元素包含所有 3 级元素。无论我尝试什么,我所有的 3 级元素似乎都生成了它们自己的 2 级元素。似乎 SAS xmlv2 libname 引擎在导入或导出完全相同的数据时甚至工作方式不同!下面重现的示例和步骤 - 如果可以,请帮助我!
示例数据
数据是文件列表和与这些文件相关的一些属性。这些属性对所有文件都是通用的,只有列表中的文件名不同。这将在 SAS 工作中创建一个测试数据集:
proc sql;
create table input_data
(col1 char(1),
col2 char(1),
file char(20));
insert into input_data
values ('1', '2', 'file1.txt')
values ('1', '2', 'file2.txt');
quit;
所需的输出 XML
请注意,所有文件名都列在各自的 FILE 元素中,嵌套在单个 FILES 元素中。公共(public)属性是主 FILE_INFO 元素中的元素。这是我需要能够输出的结构。
<?xml version="1.0" encoding="windows-1252" ?>
<FILE_INFO>
<COL1>1</COL1>
<COL2>2</COL2>
<FILES>
<FILE>file1.txt</FILE>
<FILE>file2.txt</FILE>
</FILES>
</FILE_INFO>
我创建的 SAS XMLMAP
<?xml version="1.0" encoding="windows-1252"?>
<!-- ############################################################ -->
<!-- this is a map file for SAS-XML conversion -->
<!-- ############################################################ -->
<SXLEMAP name="file_test" version="2.1">
<!-- ############################################################ -->
<OUTPUT>
<TABLEREF name="FILE_INFO"/>
</OUTPUT>
<NAMESPACES count="0"/>
<!-- ############################################################ -->
<TABLE name="FILE_INFO">
<TABLE-PATH syntax="XPath">/FILE_INFO/FILES/FILE</TABLE-PATH>
<COLUMN name="col1" retain="YES">
<PATH syntax="XPath">/FILE_INFO/COL1</PATH>
<TYPE>character</TYPE>
<DATATYPE>string</DATATYPE>
<LENGTH>1</LENGTH>
</COLUMN>
<COLUMN name="col2" retain="YES">
<PATH syntax="XPath">/FILE_INFO/COL2</PATH>
<TYPE>character</TYPE>
<DATATYPE>string</DATATYPE>
<LENGTH>1</LENGTH>
</COLUMN>
<COLUMN name="file">
<PATH syntax="XPath">/FILE_INFO/FILES/FILE</PATH>
<TYPE>character</TYPE>
<DATATYPE>string</DATATYPE>
<LENGTH>20</LENGTH>
</COLUMN>
</TABLE>
</SXLEMAP>
使用 XMLMAP 输出 XML 的 SAS 代码
filename out "C:\myfolder\test_out.xml";
libname out xmlv2 xmltype=xmlmap xmlmap="C:\myfolder\file_test.map";
data out.FILE_INFO;
set work.input_data;
run;
实际结果 XML
<?xml version="1.0" encoding="windows-1252" ?>
<FILE_INFO>
<FILES>
<FILE>file1.txt</FILE>
</FILES>
<COL1>1</COL1>
<COL2>2</COL2>
<FILES>
<FILE>file2.txt</FILE>
</FILES>
</FILE_INFO>
重现步骤
使用上面的代码生成测试数据集。将 XMLMAP 保存到 file_test.map 中。运行 SAS 代码,将生成的 XML 与所需结果进行比较。
问题
看看那里发生了什么?所有的 FILE 元素都在它们自己的 FILES 元素中。无论我的数据中有多少行具有单独的文件名,都会发生这种情况:每一行都有自己的 FILES 元素。
有趣的是,如果我获取上面所需的输出 XML 文件,并使用完全相同的 XMLMAP 将其返回 给 SAS,则生成的 SAS 数据集与我的原始输入数据集完全相同!
我试过摆弄 XMLMAP 中的 RETAIN-options,我试过将 FILES 定义为输入数据集中它自己的列并在 XMLMAP 中定义它,我试过各种随机的东西但无济于事.有什么想法吗?
最佳答案
因为您想要的 XML 涉及到一些复杂的分组,请考虑 XSLT ,专门用于转换 XML 文件的语言。 SAS 9.4 使用带有 proc xsl 的 Saxon-EE 9.3 版引擎维护 XSLT 处理器它允许 XSLT 1.0 或 2.0 脚本。
具体来说,将您的数据导出到原始 xml 文件(无映射)并使用 XSLT 1.0 的 Muenchian Grouping或更简单的 XSLT 2.0 的 xsl:for-each-group
.我将两者都包括在内,因为为了可移植性,XSLT 1.0 在其他语言库(Java、Python、PHP、R)中被更广泛地用作默认规范,以防您需要在 SAS 之外运行或 future 的读者使用早期版本。
请注意,您会看到 cols 在 concat()
内的 XSLT 中进行了硬编码和 <COL>
指定模板中的节点。对于其他列,请相应地添加到这些部分。 normalize-space()
之所以使用,是因为 SAS 在文本值之前/之后填充了空格。
XSLT 1.0 (另存为 .xsl 文件)
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output indent="yes"/>
<xsl:strip-space elements="*"/>
<xsl:key name="colkeys" match="INPUT_DATA" use="concat(col1, col2)" />
<xsl:template match="/TABLE">
<FILE_INFO>
<xsl:apply-templates select="INPUT_DATA[generate-id() =
generate-id(key('colkeys', concat(col1, col2)))]"/>
</FILE_INFO>
</xsl:template>
<xsl:template match="INPUT_DATA">
<COL1><xsl:value-of select="normalize-space(col1)"/></COL1>
<COL2><xsl:value-of select="normalize-space(col2)"/></COL2>
<FILES>
<xsl:for-each select="key('colkeys', concat(col1, col2))">
<FILE><xsl:value-of select="normalize-space(file)"/></FILE>
</xsl:for-each>
</FILES>
</xsl:template>
</xsl:stylesheet>
XSLT 2.0 (另存为 .xsl 文件)
<xsl:stylesheet version="2.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output indent="yes"/>
<xsl:strip-space elements="*"/>
<xsl:key name="colkeys" match="INPUT_DATA" use="concat(col1, col2)" />
<xsl:template match="/TABLE">
<FILE_INFO>
<xsl:for-each-group select="INPUT_DATA" group-by="concat(col1, col2)">
<COL1><xsl:value-of select="normalize-space(col1)"/></COL1>
<COL2><xsl:value-of select="normalize-space(col2)"/></COL2>
<FILES>
<xsl:for-each select="current-group()">
<FILE><xsl:value-of select="normalize-space(file)"/></FILE>
</xsl:for-each>
</FILES>
</xsl:for-each-group>
</FILE_INFO>
</xsl:template>
</xsl:stylesheet>
SAS
** EXPORT DATASET TO XML FILE;
filename out "C:\Path\Raw_Output.xml";
libname out xml;
data out.input_data;
set Work.input_data;
run;
libname out clear;
proc xsl
in="C:\Path\Raw_Output.xml"
out="C:\Path\Final_Output.xml"
xsl="C:\Path\XSLT_Script.xsl";
run;
输出
<?xml version="1.0" encoding="UTF-8"?>
<FILE_INFO>
<COL1>1</COL1>
<COL2>2</COL2>
<FILES>
<FILE>file1.txt</FILE>
<FILE>file2.txt</FILE>
</FILES>
</FILE_INFO>
关于xml - 使用 XMLMAP 从 SAS 写入分层 XML 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47928039/
正如标题中所问,我有两个如下结构的 XML 文件 A.xml //here I want to include B.xml
我有一个 xml 文件。根据我的要求,我需要更新空标签,例如我需要更改 to .是否可以像那样更改标签.. 谢谢... 最佳答案 var xmlString=" "; var properStri
我有这样简单的 XML: Song Playing 09:41:18 Frederic Delius Violin Son
在我的工作中,我们有自己的 XML 类来构建 DOM,但我不确定应该如何处理连续的空格? 例如 Hello World 当它被读入 DOM 时,文本节点应该包含 Hello 和 World
我有以下 2 个 xml 文件,我必须通过比较 wd:Task_Name_ID 和 TaskID 的 XML 文件 2。 例如,Main XML File-1 wd:Task_Name_ID 具有以下
我在 Rails 应用程序中有一个 XML View ,需要从另一个文件插入 XML 以进行测试。 我想说“构建器,只需盲目地填充这个字符串,因为它已经是 xml”,但我在文档中看不到这样做的任何内容
我正在重建一些 XML 提要,因此我正在研究何时使用元素以及何时使用带有 XML 的属性。 一些网站说“数据在元素中,元数据在属性中。” 那么,两者有什么区别呢? 让我们以 W3Schools 为例:
在同一个文档中有两个 XML 声明是否是格式正确的 XML? hello 我相信不是,但是我找不到支持我的消息来源。 来自 Extensible Markup Language
我需要在包装器 XML 文档中嵌入任意(语法上有效的)XML 文档。嵌入式文档被视为纯文本,在解析包装文档时不需要可解析。 我知道“CDATA trick”,但如果内部 XML 文档本身包含 CDAT
XML 解析器和 XML 处理器是两个不同的东西吗?他们是两个不同的工作吗? 最佳答案 XML 解析器和 XML 处理器是一样的。它不适用于其他语言。 XML 是通用数据标记语言。解析 XML 文件已
我使用这个 perl 代码从一个文件中读取 XML,然后写入另一个文件(我的完整脚本有添加属性的代码): #!usr/bin/perl -w use strict; use XML::DOM; use
我正在编写一个我了解有限的历史脚本。 对象 A 的类型为 system.xml.xmlelement,我需要将其转换为类型 system.xml.xmldocument 以与对象 B 进行比较(类型
我有以下两个 XML 文件: 文件1 101 102 103 501 502 503
我有以下两个 XML 文件: 文件1 101 102 103 501 502 503
我有一个案例,其中一个 xml 作为输入,另一个 xml 作为输出:我可以选择使用 XSL 和通过 JAXB 进行 Unmarshalling 编码。性能方面,有什么真正的区别吗? 最佳答案 首先,程
我有包含 XML 的 XML,我想使用 JAXB 解析它 qwqweqwezxcasdasd eee 解析器 public static NotificationRequest parse(Strin
xml: mario de2f15d014d40b93578d255e6221fd60 Mario F 23 maria maria
尝试更新 xml 文件数组时出现以下错误。 代码片段: File dir = new File("c:\\XML"); File[] files = dir.listFiles(new Filenam
我怎样才能完成这样的事情: PS /home/nicholas/powershell> PS /home/nicholas/powershell> $date=(Get-Date | ConvertT
我在从 xml 文件中删除节点时遇到一些困难。我发现很多其他人通过各种方式在 powershell 中执行此操作的示例,下面的代码似乎与我见过的许多其他示例相同,但我没有得到所需的行为。 我的目标是将
我是一名优秀的程序员,十分优秀!