gpt4 book ai didi

c# - XmlReader : Trouble parsing attribute without quotes

转载 作者:行者123 更新时间:2023-11-30 19:29:33 25 4
gpt4 key购买 nike

我正在尝试解析的一段 HTML 包含一些不带引号的属性值,例如宽度和高度属性:

<img src="/static/logo.png" width=75 height=90 />

在 C# 代码中,阅读器一直阅读到下一个 anchor 标记。

while (reader.ReadToFollowing("a"))

此语句报告 XmlException:

'75' is an unexpected token. The expected token is '"' or '''. Line 16, position 37.

是否有一些 XmlReaderSetting 可以使 XmlReader 更宽松?我无法控制生成的 HTML。

最佳答案

要阅读 HTML,您需要专门为此设计的阅读器。 HtmlAgilityPack可以在这里为您提供帮助,SgmlReader 也可以在 this answer 中提及至 a related question .

HTML不是 XML .它们都基于 SGML ,但遵循不同的规则。 XML 的规则比 HTML 严格得多,其中包括需要关闭所有标记以及用单引号或双引号将属性括起来。因此,除非您正在解析符合 XML 的 XHTML,否则 XmlReader 将不适合您。

关于c# - XmlReader : Trouble parsing attribute without quotes,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11936070/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com