gpt4 book ai didi

ios - 从url获取主要内容

转载 作者:行者123 更新时间:2023-11-29 12:27:23 26 4
gpt4 key购买 nike

我正在尝试构建一个 iOS 应用程序,例如 Pocket 或 Instapaper 以供练习。所以,我需要从一个 url 中获取数据并去除其中的 HTML。我创建了下面的代码来执行此操作。

NSURL *url = [NSURL URLWithString:self.link];
NSString *webData= [NSString stringWithContentsOfURL:url];

NSLog(@"webData is: %@", webData);

NSString *finalhtmlstring = [NSString stringWithFormat:@"%@", webData];
finalhtmlstring = [finalhtmlstring stringByConvertingHTMLToPlainText];

NSLog(@"FinalHTMLString is: %@", finalhtmlstring);

我如何获取页面的主体?我无法获得 NSString@"<body>" 之间和 @"</body>" , 因为有些网站给 <body> 添加了属性标签。

最佳答案

听起来像是在解析 XML 或 HTML 页面。

幸运的是,有开源库喜欢Hpple可以帮助您轻松地从包装器中获取内容。

它使用 Objective-C 对象很好地包装了 libxml2

这是一个tutorial关于如何使用这个库。

关于ios - 从url获取主要内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28659787/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com