gpt4 book ai didi

xml - 读取 StartElement 内的 XML 标签 (QXmlStreamReader)

转载 作者:行者123 更新时间:2023-12-02 03:36:43 32 4
gpt4 key购买 nike

因此,我正在尝试阅读一个中等大小的 XML 文档。它的结构如下:

<project identifier="project1">
<author>Joe Smith</author>
<author2>Rick Jones</author2>
<path>projects/internal/project2</path>
<version>1.51</version>
</project>
<project identifier="project2">
<author>Terry Chimes</author>
<author>Janie Jones</author>
<path>projects/external/project2</path>
<version>19.77</version>
</project>

...等等,数百个项目。

我正在使用Qt5.10的QXmlStreamReader ,这可能是由虐待狂创建(或记录)的。

我可以找到每个project通过使用xmlReader.readNextStartElement - 或者逐个阅读标签,直到找到具有内部属性的标签(只有 project 标签在此文件中具有属性)。

但是当我读到其中一个父元素时,QXmlStreamReader吸收每个标签直到其结束 </project>标签。问题是我需要获取其中一些数据,在本例中是 <path></path> 里面的内容。标签。

我可以使用 xmlReader.readElementText(QXmlStreamReader::IncludeChildElements 检索所有吞咽的数据,但这只是一个没有标签的大数据转储。

有谁知道我如何“倒回”并读取内部标签?或者阻止流读取器向前倾斜并吸收所有数据?

最佳答案

最可能的解释是您做错了什么,QXmlStreamReader 在解析文档时不应跳过内部元素。您没有提供任何源代码,因此无法判断您到底做错了什么。

这是我的代码示例,它在与您在 macOS 10.13.2 上使用 Qt 5.9.2 的示例非常相似:

#include <QCoreApplication>
#include <QDebug>
#include <QXmlStreamReader>
#include <QFile>
#include <QHash>

int main(int argc, char *argv[])
{
QCoreApplication a(argc, argv);

if (argc != 2) {
qWarning() << "Usage: " << argv[0] << " <file>";
return 1;
}

QFile file(argv[1]);
if (!file.open(QIODevice::ReadOnly)) {
qWarning() << "Failed to open file " << argv[1] << " for reading";
return 1;
}

QXmlStreamReader reader(&file);
QString currentProjectId;
QHash<QString,QString> pathByProjectId;
while(!reader.atEnd())
{
reader.readNext();

if (reader.isStartDocument()) {
continue;
}

if (reader.isEndDocument()) {
break;
}

if (reader.isStartElement())
{
QStringRef elementName = reader.name();
if (elementName == "project") {
QXmlStreamAttributes attrs = reader.attributes();
currentProjectId = attrs.value("identifier").toString();
}
else if (elementName == "path") {
pathByProjectId[currentProjectId] = reader.readElementText(QXmlStreamReader::IncludeChildElements);
}

continue;
}
}

for(auto it = pathByProjectId.constBegin(),
end = pathByProjectId.constEnd(); it != end; ++it)
{
qDebug() << "Path for project " << it.key() << ": " << it.value();
}

file.close();

return 0;
}

这是您的稍微修改过的示例,我将其提供给此示例程序:

<?xml version="1.0" encoding="UTF-8"?>
<body>
<project identifier="project1">
<author>Joe Smith</author>
<author2>Rick Jones</author2>
<path>projects/internal/project1</path>
<version>1.51</version>
</project>
<project identifier="project2">
<author>Terry Chimes</author>
<author>Janie Jones</author>
<path>projects/external/project2</path>
<version>19.77</version>
</project>
</body>

我在您的示例中添加的是 XML 版本/编码声明 + 高级 body 标记,以防止 QXmlStreamReader 思考第一个 project tag 是整个文档的根元素。我还更改了第一个项目的路径,使其与第二个项目的路径不同。

这是我得到的输出:

Path for project  "project1" :  "projects/internal/project1"
Path for project "project2" : "projects/external/project2"

关于xml - 读取 StartElement 内的 XML 标签 (QXmlStreamReader),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49985359/

32 4 0