gpt4 book ai didi

mediawiki - 如何使用 Wikipedia API 获取类别中所有页面的页面统计信息?

转载 作者:行者123 更新时间:2023-12-03 19:48:48 25 4
gpt4 key购买 nike

我想确定维基百科类别中最受欢迎的页面(例如,去年哪个 graph algorithms 的页面浏览量最高?)。然而,维基百科 API 的最新信息似乎很少,尤其是在获取统计数据方面。

例如,How to use Wikipedia API to get the page view statistics of a particular page in Wikipedia? 上的 StackOverflow 帖子包含似乎不再有效的答案。

我已经挖掘了一些,但除了一个非常好的网站之外,我找不到任何可用的 API,我可以在其中手动执行此操作,方法是逐个键入页面标题(最多仅 10 页):https://tools.wmflabs.org/pageviews/ .将不胜感激任何帮助。谢谢!

最佳答案

您可以使用像这样的 MediaWiki API 调用来获取类别中的标题:https://en.wikipedia.org/w/api.php?action=query&list=categorymembers&cmtitle=Category:Physics
然后你可以使用它来获取每个页面的页面查看统计信息:https://wikimedia.org/api/rest_v1/#!/Pageviews_data/get_metrics_pageviews_per_article_project_access_agent_article_granularity_start_end
(注意速率限制)

例如。去年,文章“物理学”(属于物理学类别):https://wikimedia.org/api/rest_v1/metrics/pageviews/per-article/en.wikipedia.org/all-access/all-agents/Physics/daily/20151104/20161104

如果您正在处理大类别,最好从 https://dumps.wikimedia.org/other/pageviews/2016/2016-11/ 开始下载统计信息。以避免进行如此多的 REST API 调用。

关于mediawiki - 如何使用 Wikipedia API 获取类别中所有页面的页面统计信息?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38348687/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com