gpt4 book ai didi

html - 使用 NSXMLParser 解析 HTML

转载 作者:塔克拉玛干 更新时间:2023-11-01 21:24:02 26 4
gpt4 key购买 nike

我正在开发一个应用程序,该应用程序可以聚合来自互联网的一些提要并重新格式化内容。所以我正在寻找一种解析一些 HTML 的方法。鉴于 XML 和 HTML 在结构上非常相似,我在想“也许我应该只使用 NSXMLParser”我已经在使用它来解析我的 RSS 提要并且我已经习惯使用它,但是我遇到了一个问题。

解析器无法识别<p>作为一个元素。提取像 <title> 这样的元素没有问题, 或 <img> , 但它不喜欢 <p> .有没有人尝试过这样做,如果有,您对这个问题有什么建议或解决方法吗?我认为 XMLParser 非常适合我正在做的事情,我想使用它,但显然,如果我无法在 <p> 中获取文本元素对我来说完全没用。

欢迎提出任何建议,甚至是建议完全不同的方法。我已经研究了一些第三方库来执行此操作,但从我读到的内容来看,它们都有一些错误,我更愿意使用 Apple 提供的东西。

最佳答案

“p”作为元素的名称绝对没有什么特别之处。虽然很难确定,因为您没有提供正在解析的 HTML 的示例,但问题很可能是由格式不正确的 XML 的 HTML 引起的。换句话说,使用 NSXMLParser 将适用于 XHTML,但不一定适用于普通的 HTML。

“p”元素经常出现在没有匹配结束标记的 HTML 中,这不是有效的 XML。我的猜测是,在尝试使用 NSXMLParser 解析它之前,您必须将 HTML 转换为 XHTML

关于html - 使用 NSXMLParser 解析 HTML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8866376/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com