gpt4 book ai didi

python - 用于获取维基百科编辑内容的 API

转载 作者:太空宇宙 更新时间:2023-11-03 16:01:21 28 4
gpt4 key购买 nike

我想获取维基百科页面上编辑前后的编辑文本。我有这个网址:

https://en.wikipedia.org/w/index.php?diff=328391582&oldid=328391343

但是,我想要 json 格式的文本,以便我可以直接在我的程序中使用它。 MediaWiki 是否提供任何 API 可以在编辑后为我提供旧文本和新文本,或者我是否必须使用解析器解析 HTML 页面?

最佳答案

试试这个:https://www.mediawiki.org/wiki/API:Revisions

有一些可能有用的选项,例如:

  1. rvparse:解析修订内容。出于性能原因,如果使用此选项,则 rvlimit 强制为 1。

  2. rvdifftotext:要比较每个修订版本的文本。

如果这些失败了,还有

  • rvprop/ids:获取 revid,从 1.16 开始,获取parentid
  • 然后一旦获得父 ID,就可以比较两者的文本。

    关于python - 用于获取维基百科编辑内容的 API,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40313820/

    28 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com