gpt4 book ai didi

python - 使用 Python 的维基百科 API JSON

转载 作者:行者123 更新时间:2023-11-28 21:54:35 30 4
gpt4 key购买 nike

我想从来自维基百科 API 调用的 JSON 文件中创建一个包含 Vincent van Gogh 所有画作的 Python 列表。这是我用来发出请求的 URL:

http://en.wikipedia.org/w/api.php?format=json&action=query&titles=list%20of%20works%20by%20Vincent%20van%20Gogh&Page&prop=revisions&rvprop=content

如您在浏览器中打开 URL 时所看到的那样,它是一个巨大的文本 block 。我如何开始从这个庞大的 JSON 返回中提取绘画的标题?在问这个问题之前我做了很多研究,并尝试了很多方法来解决它。如果这个 JSON 文件是一个有用的字典,那将会很有帮助,但我无法理解它。您将如何从这个 JSON 文件中提取绘画名称?

最佳答案

不是直接解析 JSON API 调用的结果,而是使用 python wrapper :

import wikipedia

page = wikipedia.page("List_of_works_by_Vincent_van_Gogh")
print page.links

还有other clients and wrappers .

或者,这里有一个使用 BeautifulSoup 的选项HTML 解析器:

>>> from bs4 import BeautifulSoup
>>> url = "http://en.wikipedia.org/wiki/List_of_works_by_Vincent_van_Gogh"
>>> soup = BeautifulSoup(urlopen(url))
>>> table = soup.find('table', class_="wikitable")
>>> for row in table.find_all('tr')[1:]:
... print(row.find_all('td')[1].text)
...
Still Life with Cabbage and Clogs
Crouching Boy with Sickle, Black chalk and watercolor
Woman Sewing, Watercolor
Woman with White Shawl
...

关于python - 使用 Python 的维基百科 API JSON,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23966766/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com