gpt4 book ai didi

hadoop - 我使用的是Pig版本.8,如何使用XPath()提取xml的特定元素?我尝试了多种方法,但没有成功。请提出建议

转载 作者:行者123 更新时间:2023-12-02 22:07:48 24 4
gpt4 key购买 nike

<CATALOG>
<BOOK>
<TITLE>Hadoop Defnitive Guide</TITLE>
<AUTHOR>Tom White</AUTHOR>
<COUNTRY>US</COUNTRY>
<COMPANY>CLOUDERA</COMPANY>
<PRICE>24.90</PRICE>
<YEAR>2012</YEAR>
</BOOK>
</CATALOG>

这是我正在使用的xml。

我只想提取TITLE和COMPANY元素。有没有办法使用Regex或XPath()来提取它们?

最佳答案

您需要做的第一件事是格式化XML,如下所示:

    <CATALOG> 
<BOOK>
<TITLE>Hadoop Defnitive Guide</TITLE>
<AUTHOR>Tom White</AUTHOR>
<COUNTRY>US</COUNTRY>
<COMPANY>CLOUDERA</COMPANY>
<PRICE>24.90</PRICE>
<YEAR>2012</YEAR>
</BOOK>
</CATALOG>

然后,您可以像这样提取这些元素:
/CATALOG/BOOK/*[self::title or self::company]

有关轴的更多信息,请参见: http://www.w3schools.com/xsl/xpath_axes.asp

关于hadoop - 我使用的是Pig版本.8,如何使用XPath()提取xml的特定元素?我尝试了多种方法,但没有成功。请提出建议,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34448333/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com