gpt4 book ai didi

javascript - 如何从 wikipedia api 获取表数据作为行和列?

转载 作者:行者123 更新时间:2023-12-02 21:01:15 24 4
gpt4 key购买 nike

当我尝试以 json 形式获取表数据时,我可以在以下查询的 json 输出中找到可区分的子项:

https://en.wikipedia.org/w/api.php?action=parse&page=List_of_football_clubs_in_India&prop=wikitext&section=3&format=json

我想获取此表的行和列(文本):-

https://en.wikipedia.org/wiki/List_of_football_clubs_in_India#Assam

JSON 输出看起来很复杂,我没有找到从中提取文本的好方法。

(我在 Javascript (Node.js) 中执行此操作

请帮忙..

最佳答案

我不确定你的期望是什么。您对页面的 API 请求实际上返回封装为 JSON 结构的 wiki 文本。但是,维基文本(其中包含表格的一部分)不是 JSON,因此您无法真正将其解释为 JSON。

我也不太确定您想要什么信息。如果您想在表中包含足球俱乐部,那么您唯一的选择就是解析 wiki 文本(您也可以从 API 返回实际解析的 HTML,以使其“更容易”)并自己查看数据。然而,这可能是一个容易出错且不有趣的任务。

因此,如果您想以结构化数据格式获取印度所有足球俱乐部,我可能最好尝试使用维基数据。它允许您处理结构化数据以获得所需的信息(如果对象具有指向维基百科页面的链接,还可以为您提供指向维基百科文章的链接)。在您的用例中,尝试 Wikidata Query service 可能是个好主意。 .

您可以在那里发出如下查询:

SELECT ?itemLabel ?sitelink WHERE {
?item wdt:P31 wd:Q476028;
wdt:P17 wd:Q668.
?sitelink schema:isPartOf <https://en.wikipedia.org/>;
schema:about ?item.
SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }
}

它查询印度所有足球俱乐部的列表,并返回一个带有项目标签的列表以及英语维基百科文章的链接: https://query.wikidata.org/#SELECT%20%3FitemLabel%20%3Fsitelink%20WHERE%20%7B%0A%20%20%3Fitem%20wdt%3AP31%20wd%3AQ476028%3B%0A%20%20%20%20%20%20%20%20wdt%3AP17%20wd%3AQ668.%0A%20%20%3Fsitelink%20schema%3AisPartOf%20%3Chttps%3A%2F%2Fen.wikipedia.org%2F%3E%3B%0A%20%20%20%20%20%20%20%20%20%20%20%20schema%3Aabout%20%3Fitem.%0A%20%20SERVICE%20wikibase%3Alabel%20%7B%20bd%3AserviceParam%20wikibase%3Alanguage%20%22%5BAUTO_LANGUAGE%5D%2Cen%22.%20%7D%0A%7D

关于javascript - 如何从 wikipedia api 获取表数据作为行和列?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61350485/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com