gpt4 book ai didi

objective-c - 哪个类最适合读取和表示 HTML 文件?

转载 作者:行者123 更新时间:2023-12-03 16:57:54 24 4
gpt4 key购买 nike

这是一个初学者问题。基础类的平台和类(class)数量实在是难以梳理,因此我希望 SO 社区能够提供现成的答案。

这是我的用例:

我想读取 html 文件并提取 p 标记中的所有文本。

我不需要显示 html 标记。但如果 Webkit 有一个解决方案,我很乐意使用它。

在Python世界中,答案将是Beautiful Soup。我正在寻找等效的 OSX 基础套件或任何可以实现目标的类(class)。

最佳答案

您可以使用 NSXMLDocument 并将 NSXMLDocumentTidyXML 作为 mask 选项之一传递。
这将允许 NSXMLDocument 解析非 XHTML 文档(如果它们的格式不是完全错误的话)。

要获取所有 p 元素的节点列表,您可以在 NSXMLDocument 实例上使用以下 XPath 表达式:
NSArray* pNodes = [projectDocumentnodesForXPath:@"//*/@p"错误:nil];

要获取 p 节点的文本内容,请使用 stringValue 属性。

关于objective-c - 哪个类最适合读取和表示 HTML 文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16807750/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com