gpt4 book ai didi

java - Stax 和 DOM 解析之间的性能差异

转载 作者:搜寻专家 更新时间:2023-11-01 01:48:15 25 4
gpt4 key购买 nike

我已经使用 DOM 很长时间了,因此 DOM 解析性能非常好。即使在处理大约 4-7 MB 的 XML 时,解析也很快。我们面临的 DOM 问题是内存占用量,一旦我们开始处理大型 XML,内存占用量就会变得很大。

最近我尝试转向 Stax(XML 流式解析器),它被认为是第二代解析器中的佼佼者(阅读有关 Stax 的文章,它说它现在是最快的解析器)。当我尝试将 Stax 解析器用于大型 XML 时,大约 4MB 的内存占用明显减少,但解析整个 XML 并从中创建 Java 对象所花费的时间比 DOM 增加了近 5 倍。

我使用了 Stax 的 sjsxp.jar 实现。

我可以在某种程度上从逻辑上推断,由于解析器的流媒体特性,性能可能不会非常好,但减少了 5 次(例如,DOM 需要大约 8 秒来为这个 XML 构建对象,而 Stax 解析需要大约 40平均秒数)绝对不会被接受。

我是否完全遗漏了一些要点,因为我无法接受这些性能数据

最佳答案

package parsers;

/**
*
* @author Arthur Kushman
*/

import java.io.File;
import java.io.IOException;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;

import org.w3c.dom.Document;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.w3c.dom.Element;


public class DOMTest {

public static void main(String[] args) {
long time1 = System.currentTimeMillis();
try {
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
DocumentBuilder db = dbf.newDocumentBuilder();
Document doc = db.parse(new File("/Users/macpro/Desktop/myxml.xml"));
doc.getDocumentElement().normalize();
// System.out.println("Root Element: "+doc.getDocumentElement().getNodeName());
NodeList nodeList = doc.getElementsByTagName("input");
// System.out.println("Information of all elements in input");

for (int s=0;s<nodeList.getLength();s++) {
Node firstNode = nodeList.item(s);
if (firstNode.getNodeType() == Node.ELEMENT_NODE) {
Element firstElement = (Element)firstNode;
NodeList firstNameElementList = firstElement.getElementsByTagName("href");
Element firstNameElement = (Element)firstNameElementList.item(0);
NodeList firstName = firstNameElement.getChildNodes();
System.out.println("First Name: "+((Node)firstName.item(s)).getNodeValue());
}
}


} catch (Exception ex) {
System.out.println(ex.getMessage());
System.exit(1);
}
long time2 = System.currentTimeMillis() - time1;
System.out.println(time2);
}

}

45 米尔斯

package parsers;

/**
*
* @author Arthur Kushman
*/
import javax.xml.stream.*;
import java.io.*;
import javax.xml.namespace.QName;

public class StAXTest {

public static void main(String[] args) throws Exception {
long time1 = System.currentTimeMillis();
XMLInputFactory factory = XMLInputFactory.newInstance();
// factory.setXMLReporter(myXMLReporter);
XMLStreamReader reader = factory.createXMLStreamReader(
new FileInputStream(
new File("/Users/macpro/Desktop/myxml.xml")));

/*String encoding = reader.getEncoding();

System.out.println("Encoding: "+encoding);

while (reader.hasNext()) {
int event = reader.next();
if (event == XMLStreamConstants.START_ELEMENT) {
QName element = reader.getName();
// String text = reader.getText();
System.out.println("Element: "+element);
// while (event != XMLStreamConstants.END_ELEMENT) {
System.out.println("Text: "+reader.getLocalName());
// }
}
}*/

try {
int inElement = 0;
for (int event = reader.next();event != XMLStreamConstants.END_DOCUMENT;
event = reader.next()) {
switch (event) {
case XMLStreamConstants.START_ELEMENT:
if (isElement(reader.getLocalName(), "href")) {
inElement++;
}
break;
case XMLStreamConstants.END_ELEMENT:
if (isElement(reader.getLocalName(), "href")) {
inElement--;
if (inElement == 0) System.out.println();
}
break;
case XMLStreamConstants.CHARACTERS:
if (inElement>0) System.out.println(reader.getText());
break;
case XMLStreamConstants.CDATA:
if (inElement>0) System.out.println(reader.getText());
break;
}
}
reader.close();
} catch (XMLStreamException ex) {
System.out.println(ex.getMessage());
System.exit(1);
}
// System.out.println(System.currentTimeMillis());
long time2 = System.currentTimeMillis() - time1;
System.out.println(time2);
}

public static boolean isElement(String name, String element) {
if (name.equals(element)) return true;
return false;
}

}

23 米尔斯

StAX 获胜 =)

关于java - Stax 和 DOM 解析之间的性能差异,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2520950/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com