java - 在java中如何根据字符串过滤出xml中的子节点-6ren

java - 在java中如何根据字符串过滤出xml中的子节点

转载作者：行者123 更新时间：2023-12-01 19:27:42

25

4

我正在编写一个java程序，它从文件路径读取并创建一个sitemap.xml .

sitemap.xml看起来像这样

<loc>http://localhost/content/falcon/en/index/auto</loc>
<lastMod>2019-12-05</lastMod>
<changefreq>weekly</changefreq>
<priority>0.0</priority>
<testing>admin</testing>
</url>
<url>

<loc>
http://localhost/content/falcon/en/index/auto/coverage
</loc>
<lastMod>2019-09-11</lastMod>
<changefreq>weekly</changefreq>
<priority>0.9</priority>
<testing>admin</testing>
</url>

<url>
<loc>
http://localhost/content/falcon/en/index/auto/collectible
</loc>
<lastMod>2019-01-17</lastMod>
<changefreq>weekly</changefreq>
<priority>0.9</priority>
<testing>ben.snedeker@tallwave.com</testing>
</url>

<url>
<loc>
http://localhost/content/falcon/en/index/auto/collectible/features-discounts
</loc>
<lastMod>2016-12-30</lastMod>
<changefreq>weekly</changefreq>
<priority>0.8</priority>
<testing>usw8453</testing>
</url>

标签内<loc> </loc>包含一个最初是字符串的url，根据我希望能够过滤掉整个节点的url，包括它的同级标签，如 <lastMod> <changefrequency> <priority>等等

这是正在写入 xml 表的 java

         Resource resource = resourceResolver.getResource(sitemapRootPath);
        if(resource != null) {
            response.setContentType("text/xml;charset=UTF-8");  
            Page page = resource.adaptTo(Page.class);
            Iterator<Page> pageIterator = page.listChildren();

            //Initializing the XML document before writing data into the file
            DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
            DocumentBuilder builder;
            try {
                LOG.info("Inside Try");
                builder = factory.newDocumentBuilder();
                Document document = builder.newDocument();

                Element rootElement = document.createElement("urlset");
                rootElement.setAttribute("xmlns", "http://www.sitemaps.org/schemas/sitemap/0.9");
                document.appendChild(rootElement);

                for(int i = 0; i < staticPageData.length; i ++) {
                    createXMLNodeForStaticPages(document, rootElement, request, staticPageData[i]);
                }

                while(pageIterator.hasNext()) { 



                    createXMLNode(document, rootElement, request, pageIterator);
                }


                Transformer transformer = TransformerFactory.newInstance().newTransformer();
                transformer.setOutputProperty(OutputKeys.INDENT, "yes");
                transformer.setOutputProperty("{http://xml.apache.org/xslt}indent-amount", "2");

                //initialize StreamResult with File object to save to file
                StreamResult result = new StreamResult(new StringWriter());
                DOMSource source = new DOMSource(document);
                transformer.transform(source, result);
                String xmlString = result.getWriter().toString();
                out.print(xmlString);

这是上面的 while 循环调用的方法。它也在底部的 for 循环中写入子页面的 xml。

public void createXMLNode(Document document, Element rootElement, SlingHttpServletRequest request, Iterator<Page> pageIterator) {
        Element headElement = document.createElement("url");
        Element locElement = document.createElement("loc");
        Element lastModElement = document.createElement("lastMod");
        Element changefreqElement = document.createElement("changefreq");
        Element priorityElement = document.createElement("priority");
        Element testingElement = document.createElement("testing");

        Node locElementNode = locElement;
        Node lastModElementNode = lastModElement;
        Node changefreqElementNode = changefreqElement;
        Node priorityElementNode = priorityElement;
        Node testingElementNode = testingElement;

        Page childPage = pageIterator.next();
        String location = request.getScheme() + "://" + request.getServerName() + childPage.getPath();
        locElementNode.setTextContent(location);


        LOG.error("childPage.getLastModified()" + childPage.getLastModified());
        if(null != childPage.getLastModified()) {
            Date date = childPage.getLastModified().getTime();
            DateFormat dateFormat = new SimpleDateFormat("yyyy-MM-dd", Locale.US);
            try {
                dateFormat.parse("2019-07-15");
            } catch (ParseException e) {
                // TODO Auto-generated catch block
                e.printStackTrace();
            }
            lastModElementNode.setTextContent(dateFormat.format(date));
        }


       String editor = childPage.getLastModifiedBy();

        changefreqElementNode.setTextContent("weekly");


        priorityElementNode.setTextContent(PriorityValue(location));
        testingElementNode.setTextContent(editor);


        rootElement.appendChild(headElement);
        headElement.appendChild(locElementNode);
        headElement.appendChild(lastModElementNode);
        headElement.appendChild(changefreqElementNode);
        headElement.appendChild(priorityElementNode);
        headElement.appendChild(testingElementNode);

        Iterator<Page> childPageIterator =  childPage.listChildren();




        while(childPageIterator.hasNext()) {

            createXMLNode(document, rootElement, request, childPageIterator);
        }
    }

我希望能够在读取某个字符串时跳过整个子节点。例如最初 loc 内的属性只是从该 java 类读取的文件路径中读取的字符串。

        String location = request.getScheme() + "://" + request.getServerName() + childPage.getPath();
locElementNode.setTextContent(location);

它被放置在一个可变位置，然后我们设置 locElementNode具有该值。我希望能够在读取某个 url 字符串时过滤掉整个节点。 while 循环应跳至 next 的下一个元素。

最佳答案

好吧，您需要做的只是在创建任何元素并附加它们之前添加逻辑来检查返回的字符串


public void createXMLNode(Document document, Element rootElement, SlingHttpServletRequest request, Iterator<Page> pageIterator) {

        String location = request.getScheme() + "://" + request.getServerName() + childPage.getPath();
        if (location.equals("<banned url>") {
            return;
        }
        Element headElement = document.createElement("url");
        Element locElement = document.createElement("loc");
        Element lastModElement = document.createElement("lastMod");
        Element changefreqElement = document.createElement("changefreq");
        Element priorityElement = document.createElement("priority");
        Element testingElement = document.createElement("testing");

        Node locElementNode = locElement;
        Node lastModElementNode = lastModElement;
        Node changefreqElementNode = changefreqElement;
        Node priorityElementNode = priorityElement;
        Node testingElementNode = testingElement;

        Page childPage = pageIterator.next();        
        locElementNode.setTextContent(location);

 ....

关于java - 在java中如何根据字符串过滤出xml中的子节点，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59293032/

25

4

0

文章推荐： chess - 国际象棋游戏的面向对象设计

文章推荐： iphone - Objective-C IOS 调用屏幕

文章推荐： objective-c - 在UIDocumentInteractionController中解锁PDF和显示

文章推荐： xcode - 无法再在Xcode 4中存档

xml - 如何在没有源 xml 文件根节点的情况下将一个 xml 文件包含在另一个 xml 中？
正如标题中所问，我有两个如下结构的 XML 文件 A.xml //here I want to include B.xml
c# - 如何将等 xml 标签格式更改为
我有一个 xml 文件。根据我的要求，我需要更新空标签，例如我需要更改 to .是否可以像那样更改标签.. 谢谢... 最佳答案 var xmlString=" "; var properStri
xml - Golang : get inner xml from xml with xml.解码
我有这样简单的 XML: Song Playing 09:41:18 Frederic Delius Violin Son
xml - XML 阅读器是否应该忽略 XML 文件中的连续空格？
在我的工作中，我们有自己的 XML 类来构建 DOM，但我不确定应该如何处理连续的空格？例如 Hello World 当它被读入 DOM 时，文本节点应该包含 Hello 和 World
xml - 比较来自不同 XML 文件的元素值并附加到第一个 XML
我有以下 2 个 xml 文件，我必须通过比较 wd:Task_Name_ID 和 TaskID 的 XML 文件 2。例如，Main XML File-1 wd:Task_Name_ID 具有以下
xml - 使 XML 构建器从字符串中插入 XML
我在 Rails 应用程序中有一个 XML View ，需要从另一个文件插入 XML 以进行测试。我想说“构建器，只需盲目地填充这个字符串，因为它已经是 xml”，但我在文档中看不到这样做的任何内容
xml - XML 数据和 XML 元数据之间有什么区别？
我正在重建一些 XML 提要，因此我正在研究何时使用元素以及何时使用带有 XML 的属性。一些网站说“数据在元素中，元数据在属性中。” 那么，两者有什么区别呢？让我们以 W3Schools 为例:
xml - 文档中的多个 XML 声明是否为格式正确的 XML？
在同一个文档中有两个 XML 声明是否是格式正确的 XML？ hello 我相信不是，但是我找不到支持我的消息来源。来自 Extensible Markup Language
xml - 在 XML 中包装任意 XML
我需要在包装器 XML 文档中嵌入任意(语法上有效的)XML 文档。嵌入式文档被视为纯文本，在解析包装文档时不需要可解析。我知道“CDATA trick”，但如果内部 XML 文档本身包含 CDAT
xml - XML 解析器和 XML 处理器是否相同？
XML 解析器和 XML 处理器是两个不同的东西吗？他们是两个不同的工作吗？最佳答案 XML 解析器和 XML 处理器是一样的。它不适用于其他语言。 XML 是通用数据标记语言。解析 XML 文件已
xml - 在保留格式的同时从文件读取 XML 和从文件读取 XML
我使用这个 perl 代码从一个文件中读取 XML，然后写入另一个文件(我的完整脚本有添加属性的代码): #!usr/bin/perl -w use strict; use XML::DOM; use
xml - 使用 PowerShell 将 system.xml.xml 元素转换为 system.xml.xml 文档
我正在编写一个我了解有限的历史脚本。对象 A 的类型为 system.xml.xmlelement，我需要将其转换为类型 system.xml.xmldocument 以与对象 B 进行比较(类型
xml - 如何将子节点结构从一个 XML 文件复制到另一个 XML 文件(合并两个 XML 文件)？
我有以下两个 XML 文件: 文件1 101 102 103 501 502 503
xml - 如何将子节点结构从一个 XML 文件复制到另一个 XML 文件(合并两个 XML 文件)？
我有以下两个 XML 文件: 文件1 101 102 103 501 502 503
java - 转换性能 XML>XSL>XML 与 XML>JAXB>XML
我有一个案例，其中一个 xml 作为输入，另一个 xml 作为输出:我可以选择使用 XSL 和通过 JAXB 进行 Unmarshalling 编码。性能方面，有什么真正的区别吗？最佳答案首先，程
java - 从 XML 元素获取 XML 时的标签顺序(XML 包含 XML)？
我有包含 XML 的 XML，我想使用 JAXB 解析它 qwqweqwezxcasdasd eee 解析器 public static NotificationRequest parse(Strin
xml - 无法使用 XML 架构和 Perl (XML::LibXML) 验证 XML
xml: mario de2f15d014d40b93578d255e6221fd60 Mario F 23 maria maria
java.net.MalformedURLException : no protocol: [c:\XML\file. xml，c :\XML\file2. xml，c :\XML\file3. xml]
尝试更新 xml 文件数组时出现以下错误。代码片段: File dir = new File("c:\\XML"); File[] files = dir.listFiles(new Filenam
xml - 如何使用 ConvertTo-Xml 和 Select-Xml 加载或读取 XML 文件？
我怎样才能完成这样的事情: PS /home/nicholas/powershell> PS /home/nicholas/powershell> $date=(Get-Date | ConvertT
xml - 删除 XML 节点以将 XML 日志文件的大小减小到给定大小
我在从 xml 文件中删除节点时遇到一些困难。我发现很多其他人通过各种方式在 powershell 中执行此操作的示例，下面的代码似乎与我见过的许多其他示例相同，但我没有得到所需的行为。我的目标是将

首页

博学

6Ren·AI

商城

java - 在java中如何根据字符串过滤出xml中的子节点