c - 在 C 中使用 libxml 进行 XML 解析不显示属性名称-6ren

c - 在 C 中使用 libxml 进行 XML 解析不显示属性名称

转载作者：太空宇宙更新时间：2023-11-04 02:46:08

24

4

我正在尝试解析 XHTML 文件并获取属性及其值。使用 libxml。

#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <libxml/HTMLparser.h>
#include <libxml/xmlmemory.h> 
#include <libxml/tree.h>
#include <libxml/parser.h>

void walkTree(xmlNode * a_node)
{
  xmlNode *cur_node = NULL;
  xmlAttr *cur_attr = NULL;
  for (cur_node = a_node; cur_node; cur_node = cur_node->next) {
     // do something with that node information, like… printing the tag’s name and attributes
     printf("Got tag : %s\n", cur_node->name);
     for (cur_attr = cur_node->properties; cur_attr; cur_attr = cur_attr->next) {
     printf("  -> with attribute : %s\n", cur_attr->name);
     printf("     -> with Value: %s\n", (cur_attr->children)->name);
}
walkTree(cur_node->children);
}
}
int main(void)
{  
// Load XHTML
char *data;
data = "<html><body class=\"123\" damn=\"123\"></html>";

int len = strlen(data) + 1;
htmlParserCtxtPtr parser = htmlCreatePushParserCtxt(NULL, NULL, NULL, 0, NULL, 0);
htmlCtxtUseOptions(parser, HTML_PARSE_NOBLANKS | HTML_PARSE_NOERROR | HTML_PARSE_NOWARNING | HTML_PARSE_NONET);
htmlParseChunk(parser, data, len, 0);
htmlParseChunk(parser, NULL, len, 1);
walkTree(xmlDocGetRootElement(parser->myDoc));

 }

我期待这个输出

 Got tag: html
Got tag: body
-> with attribute: class
  -> with value: 123
-> with attribute: damn
  -> with value: 123

但不幸的是我得到了这个输出:

 Got tag: html
Got tag: body
-> with attribute: class
  -> with value: text
-> with attribute: damn
  -> with value: text

我也尝试过其他 html 代码，无论属性值是什么，它总是显示“文本”而不是值。

为什么？如何解决？如何获取真实的属性值？

最佳答案

这可以很容易地通过修改一行代码来实现。xmlNodeGetContent() 因为它接受 xmlNode。不像 xmlGetProp() 接受 xmlNodePtr。所以最好使用 xmlNodeGetContent() 在使用 xmlNode 或 xmlAttr 时获取节点的属性.希望有所帮助:)

解决方法如下:

 #include <stdio.h>
 #include <string.h>
 #include <stdlib.h>
 #include <libxml/HTMLparser.h>
 #include <libxml/xmlmemory.h>
 #include <libxml/tree.h>
 #include <libxml/parser.h>
 void walkTree(xmlNode * a_node)
 {
    xmlNode *cur_node = NULL;
    xmlAttr *cur_attr = NULL;
    xmlChar *attr;
    for (cur_node = a_node; cur_node; cur_node = cur_node->next) {
    // do something with that node information, like… printing the tag’s name and attributes
    printf("Got tag : %s\n", cur_node->name);
    for (cur_attr = cur_node->properties; cur_attr; cur_attr = cur_attr->next) {

       printf("  -> with attribute : %s\n", cur_attr->name);

       // This part fixed the code :D 
       attr =  xmlNodeGetContent(cur_attr);

      printf("     -> with Value: %s\n", attr);
    }
   walkTree(cur_node->children);
}
}
int main(void)
{
// Load XHTML
char *data;
data = "<html><body class=\"123\" damn=\"123\"></html>";

    int len = strlen(data) + 1;
    htmlParserCtxtPtr parser = htmlCreatePushParserCtxt(NULL, NULL, NULL, 0, NULL, 0);
     htmlCtxtUseOptions(parser, HTML_PARSE_NOBLANKS | HTML_PARSE_NOERROR | HTML_PARSE_NOWARNING | HTML_PARSE_NONET);
     htmlParseChunk(parser, data, len, 0);
     htmlParseChunk(parser, NULL, len, 1);
     walkTree(xmlDocGetRootElement(parser->myDoc));

}

关于c - 在 C 中使用 libxml 进行 XML 解析不显示属性名称，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/27215736/

24

4

0

文章推荐： c - 我如何正确地在 C 中进行键捕获？

文章推荐： c - 内联 asm 代码组织

文章推荐： python - 为什么 Keras 层定义使用嵌套函数？

文章推荐： c - seccomp-bpf - 如何使用 bpf 过滤系统调用的参数？

perl - 无法为模块 XML::LibXML 加载 'C:/strawberry/perl/site/lib/auto/XML/LibXML/LibXML.dll'
我已经下载了草莓 PERL 并在 Winxp sp3 上使用 CGI Perl Apache 编写了一个应用程序。我使用的库之一(由其他人编写)使用 XML::LibXML。当我加载页面时，它给出内部
objective-c - "config.h"由 libxml 使用但未与 libxml 捆绑
libxml 在 libxml.h 中使用以下代码行，但它不与 libxml 捆绑在一起。 #include "config.h" 我正在尝试在 Swift 中使用 XMPPFramework for
linux - 编译 FSL : 'fatal error: libxml++/libxml++.h: No such file or directory'
我知道这个问题经常出现，但我查看了所有其他答案，但没有一个与我相关。我正在尝试从源代码编译神经成像软件 FSL(我必须这样做，我的 Linux 发行版不支持它)。我已按照所有说明进行操作 liste
c - fatal error : libxml/tree. h : No such file or directory libxml/tree. h。在 cyrus-imapd 中
当我运行 cyrus-imapd-2.4.17-caldav-beta9 时出现以下错误: In file included from httpd.c:68:0: httpd.h:48:25: fat
XML::LibXML 和命名空间
我熟悉 XML，已经将它用于一些简单的用途。但是，我被要求创建一个自定义解决方案(必须使用 Perl)来向 AuthorizeNet 的网关提交付款。 AuthNet 不提供对 Perl 的支持，所以
Perl、LibXML 和模式
我有一个示例 Perl 脚本，我试图根据模式加载和验证文件，它们询问各种节点。 #!/usr/bin/env perl use strict; use warnings; use XML::LibXM
Perl libXML 按属性值查找节点
我有我正在迭代的非常大的 XML 文档。 XML 主要使用属性而不是节点值。我可能需要在文件中找到许多节点来拼凑一组信息。它们通过不同的 ref 标签值联系在一起。目前，每次我需要定位其中一个节点以从
perl - LibXML - 插入注释
我正在使用 XML::LibXML，我想添加一条注释，使注释位于标签之外。甚至可以把它放在标签外面吗？我试过 appendChild，insertBefore |之后，没有区别... jun
perl - LibXML - 插入注释
我正在使用 XML::LibXML，我想添加一条注释，使注释位于标签之外。甚至可以把它放在标签外面吗？我试过 appendChild，insertBefore |之后，没有区别... jun
c - LibXML 内部和输出编码
我正在尝试使用 ISO-8859-1 中的 libxml2 编写 XML 文件。但从文档看来，对于我创建的每个文本节点，我都必须转换为 UTF-8，这是 libxml 的内部编码。然后，当调用 xml
c++ - 搜索节点 - Libxml
我正在尝试用 C++ 解析 XML 文档。我没有与文档关联的任何形式的元数据。由于我是 XML 的新手，所以我想了解解析此 xml 的最佳方法。我正在使用 libxml2 来实现这一点。我目前正在做
C libxml 编码问题。
使用 libxml2 两天后我就遇到了一个问题，这让我很烦。基本上，我使用套接字通过网络发送一个 xml 缓冲区。当我在服务器上收到它并尝试解析它时，它说: parser error : Input
html - libxml 在空格处拆分文本节点
我正在使用 libxml 的 HTML 解析器来创建 html 文档的 dom 树。 libxml 将每个节点的文本内容作为一个整体字符串(节点)给出，但我的要求是进一步拆分每个文本节点的空格并创建尽
c - libxml xmlXPathEvalExpression顺序
我已经开始在 C 中使用 libxml，并且正在使用 xmlXPathEvalExpression 函数来计算 XPath。我的 XML 文件实际上代表一个表，每个子节点代表该表中的一行，其属性是对
使用 libxml 时无法编译
我有一个可以通过终端运行的源文件 gcc source.c -I/usr/include/libxml2 -lxml2 -o output 但是当我 #include 包含 libxml 源文件的源文
XML::LibXML 的文本节点父节点概念
这里似乎有些奇怪。在下面的示例中，我通过 XPath 查询 ( //book/isbn/text() ) 访问文本节点。 text()有必要强制XML::LibXML允许我使用 XML::LibXM
excel - 具有默认命名空间的 XML::LibXML
我有一个 XML 文件，如下示例.xml test 以下代码未找到 id 标记值: use XML::LibXML; my $filename = 'example.xml'; my
perl - XML::LibXML - 检测两个元素是否相同？
我正在与 XML::LibXML 一起工作在 Perl 中。假设我有两个 $element由不同(不透明)XPath 查询获得的引用。 (如何)我可以确定，如果两个$element (节点)refs
xml - Perl LibXML 和多个命名空间
我有一个问题，我肯定可以使用一些帮助。首先，要温柔。我是 perl 和 LibXML 的新手。我一直在解析文档并将元素放入一个数组中，然后将其写入电子表格列。在测试过程中发现一些节点有多个同名的子节点
Perl XML::LibXML:如何访问注释节点
在我的一生中，我无法找出正确的代码来访问我的 XML 文件中的注释行。我是否使用 findnodes , find , getElementByTagName (怀疑)。我是否正确假设这些评论行是可

首页

博学

6Ren·AI

商城

c - 在 C 中使用 libxml 进行 XML 解析不显示属性名称