objective-c - 抓取和解析维基百科页面-6ren

objective-c - 抓取和解析维基百科页面

转载作者：太空狗更新时间：2023-10-30 03:48:14

25

4

我想知道 Objective-C 中是否有任何现有的库或可从中访问这些库可以让我抓取格式类似于 this one 的页面.具体来说，所有日期和每个日期旁边的所有文本。如果没有，执行此操作的最佳方法是什么？常用表达？我听说 NSString 可能已经为此内置了方法。这是真的吗？

我四处寻找是否有任何替代抓取的方法，例如 XML 文件或 API。我确实找到了一个 API，但我看到唯一可用的客户端是其他语言的，它们似乎只能将内容发布到页面，而不能检索它。

编辑:所以我在这些链接中找到了有关 API 的更多信息:

我能够想出 this request它返回一些 HTML 编码的文本(格式是 XML，但它包括页面的文本，例如 »a href= 等。我会继续查看文档，看看我是否可以做到这一点结果会好一点，如果不是，是否有任何关于解析它的建议？

编辑 2:好的，感谢 this doc page ，我能够检索数据的最简单和最干净的方法是使用这个 constructed link它返回相关部分的原始数据(在 wiki 标记中)。但是，我想我随后需要对其进行解析，但如果确实如此，它应该比整篇文章容易得多。

有人对在 Objective-C 中解析 wiki 标记有什么建议吗？

==Events==
* [[710]] &ndash; [[Saracen]] invasion of [[Sardinia]].
*[[1275]] &ndash; Traditional founding of the city of [[Amsterdam]].
*[[1682]] &ndash; [[Philadelphia]], [[Pennsylvania]] is founded.

我想最终得到的是，我猜是一个 NSDictionary 或类似的集合，它将存储带有信息片段的日期。谢谢!

最佳答案

将 &format=fmt 添加到查询的末尾，如 API:Data_formats 中所述.您的查询变为:JSON query ，例如。您可以指定 XML、JSON 或许多其他格式。

您可以轻松地解析整个部分，然后将 HTML 格式的输出显示到 WebView 中。

关于objective-c - 抓取和解析维基百科页面，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/1633296/

25

4

0

文章推荐： objective-c - Objective-C 中的动态类创建

文章推荐： iphone - presentModalViewController 可以在启动时工作吗？

文章推荐： iphone - NSMutableArray addObject，无法识别的选择器

Sharepoint 维基
好吧，我看过一些帖子提到其他一些关于不使用 SP wiki 的帖子，因为它们很糟糕。既然我们正在考虑在 SP 中创建 wiki，我需要知道为什么我们不应该让 6 名自动化开发人员来记录各种自动化流程
git - 差异 GitLab 维基
在 GitLab Wiki 部分，可以查看保存更改的历史记录。但是，当您单击提交链接时，它将显示该保存中存在的整个文件。有谁知道一种方法来区分提交以仅获取两个提交之间的差异？这类似于它在 merge
javascript - 维基 API 请求不起作用
我使用了 Wiki API 文档中的一些示例代码，但是当我输入搜索项时，没有任何反应。控制台中没有错误，什么也没有。如果我将 URL 输入到浏览器中，URL 本身就会起作用，所以我认为代码中的某些内容
wiki - BitBucket 维基 : Create a hierarchy structure?
我想在我的 wiki 中创建一个层次结构，如下所示: General FooPages Foo1 Foo2 Foo3 ODP Bar Baz 我想创建这些页
python - Python 维基 map API (PyMapia)
我正在尝试使用为 Python 制作的 Wikimapia 的 pymapia API，但无法理解如何正确使用它。 import pymapia as PyMapia a = PyMapia.PyMa
ios - OS X 维基/博客服务器 API
我正在开发适用于 iOS 的客户端应用程序，用于在 Mac OS X 服务器(Snow Leopard 和 Lion)上编辑内置的 Wiki/Blog。看来我们可以使用 MetaWeblog 、At
url-rewriting - 哪种 URL 重写方案更可取？维基/博客风格？
我正在编写一些 URL 重写软件，我想从多个角度了解哪种 URL 方案更可取: 博客风格:my-chemistry-answer -- 为什么？ -- (不可取，技术性) Wiki 风格:My_Che
azure-devops - Azure DevOps 维基 : How can I link the subpages in the parent page?
我一直试图找到一种方法来在 Azure DevOps Wiki 中创建子页面的目录。我从其他 wiki 服务中找到了方法。在 Confluence 中，他们有一个用于“ child 显示”的宏我为

首页

博学

6Ren·AI

商城

objective-c - 抓取和解析维基百科页面