gpt4 book ai didi

api - 使用属性查询维基百科页面

转载 作者:行者123 更新时间:2023-12-04 21:20:52 25 4
gpt4 key购买 nike

我需要使用 Wikipedia API Query 或任何其他 api(例如 Opensearch)来查询具有某些属性的简单页面列表。

输入:页面(文章)标题或 ID 列表。
输出:一个页面列表,每个页面包含以下属性:
页面编号
标题
片段/描述(如在 opensearch api 中)
网页网址
图片网址(如在 opensearch api 中)

类似这样的结果:
http://en.wikipedia.org/w/api.php?action=opensearch&search=miles%20davis&limit=20&format=xml
仅包含页面 ID 而不是用于搜索,而是按标题或 pageid 列出的准确页面列表。

这应该是一件相当简单的事情,但我已经坚持了很长一段时间,尝试了 MW api 手册中的各种 URL 组合,但没有成功。

最佳答案

我认为没有比 Open Search API 更好的方法了获取开放搜索数据,但根据您感兴趣的维基百科,可能会安装其他扩展程序来帮助您。以英文维基百科为例,我们可以利用MobileFrontendPageImages扩展,这恰好发生在 be installed there .

  • 标题网址 可从 native MediaWiki API 获得。要获取 url,您可以使用 prop=info , 并用 inprop=url 指定这是您感兴趣的网址。
  • 突出图片 页面的返回由 prop=pageimages 返回,感谢 PageImages。
  • MobileFrontend 添加了一个名为 extracts 的属性,您可以使用指令 exintro获取 第一段 .但是请注意,MediWiki 标记很复杂,结果可能并不总是完美的。如果我们将它们放在一个查询中,它将是这样的:

  • http://en.wikipedia.org/w/api.php?action=query&pageids=21482&prop=pageimages|info|extracts&inprop=url&exintro

    给这个:
    <api>
    <query>
    <pages>
    <page pageid="21482" ns="0" title="Nairobi" pageimage="Nairobi_Montage.jpg" contentmodel="wikitext" pagelanguage="en" touched="2014-02-06T06:10:01Z" lastrevid="594161616" counter="" length="89157" fullurl="http://en.wikipedia.org/wiki/Nairobi" editurl="http://en.wikipedia.org/w/index.php?title=Nairobi&amp;action=edit">
    <thumbnail source="http://upload.wikimedia.org/wikipedia/commons/thumb/6/66/Nairobi_Montage.jpg/45px-Nairobi_Montage.jpg" width="45" height="50" />
    <extract xml:space="preserve">
    &lt;p&gt;&lt;b&gt;Nairobi&lt;/b&gt; /naɪˈroʊbi/ is the [...]
    </extract>
    </page>
    </pages>
    </query>
    </api>

    关于api - 使用属性查询维基百科页面,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11903731/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com