gpt4 book ai didi

php - 如何通过 pageid 获取维基百科中特定页面的所有链接(id)

转载 作者:搜寻专家 更新时间:2023-10-31 21:36:25 26 4
gpt4 key购买 nike

我正在尝试使用 Wiki API 构建查询,它将以 id 格式返回特定文章的所有内部链接。我有一些文章的 pageId。例如,文章“Android(操作系统)”的 ID 是 12610483。在我的客户端,我只需要使用 id,然后仅通过 id 获取所有信息。我的目标是从给定的文章 ID 中找到所有内部链接(文章的 ID)。

不幸的是,我找到的唯一可能的方法是获取由文章标题表示的链接: http://en.wikipedia.org/w/api.php?action=parse&format=json&pageid=12610483&prop=links

除了标题,还有其他方法可以获取链接的 ID 吗?

最佳答案

您要做的是使用action=query&prop=linkspagelinks 数据库表中获取数据,而不是解析页面文本。

这仍然只会为您提供页面标题(因为链接可能会指向一个不存在的页面,这意味着没有页面 ID)。

但是您可以通过使用 prop=links 作为生成器来解决这个问题:

http://en.wikipedia.org/w/api.php?action=query&format=json&pageids=12610483&generator=links&gpllimit=max

如果文章有很多链接(就像您建议的那样),您将需要使用分页(参见 gplcontinue 元素)。

关于php - 如何通过 pageid 获取维基百科中特定页面的所有链接(id),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18432650/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com