gpt4 book ai didi

解析维基百科国家、地区、城市

转载 作者:行者123 更新时间:2023-12-02 17:43:12 27 4
gpt4 key购买 nike

是否可以获得维基百科上所有有关系的国家、地区和城市的列表?我找不到任何适合此任务的 API。解析我需要的所有信息的最简单方法是什么?PS:我知道,我可以从其他数据源获取此信息。但我对维基百科感兴趣...

最佳答案

[2020 更新] 现在最好使用维基数据查询服务来完成,您可以使用一些 SPARQL 运行 super 特定查询,例如:Find all countries and their label 。请参阅Wikidata Query Help

<小时/>

获取整个图表可能有点乏味,但您可以从实验/非官方 Wikidata Query API 获取大部分数据。 .

我建议采用以下工作流程:

  • 转到您想要使用的实体类型的实例,例如 Estonia (Q191)并查找其实例(P31)属性,您会发现:国家、主权国家、联合国成员、欧盟成员等。

  • 使用 Wikidata Query API claim 命令输出每个实体作为所选的 P31 属性。让我们试试 country (Q6256) :

    http://wdq.wmflabs.org/api?q=claim[31:6256]

它输出一个数字 ID 数组:这就是您的国家/地区! (请注意,结果仍然不完整,因为只找到了 141 个项目:维基数据中缺少国家/地区,或者正如 Nemo 在评论中建议的那样,可以在 country (Q6256) subclasses(P279) 中找到某些国家/地区)

  • 您可能想要的不仅仅是 ID,所以您可以询问 Wikidata Official API对于实体数据:

    https://www.wikidata.org/w/api.php?action=wbgetentities&ids=Q16&format=json&props=labels|claims&languages=en|fr

    (此处为加拿大(Q16)数据,采用 json 格式,仅包含声明和标签数据,采用英语和法语。查看 documentation 以根据您的需求调整参数)

一次可以查询多个实体,上限为 50 个,如下所示:

https://www.wikidata.org/w/api.php?action=wbgetentities&ids=Q16|Q17|Q20|Q27|Q28|Q29|Q30|Q31|Q32|Q33|Q34|Q35|Q36|Q37|Q38|Q39|Q40|Q41|Q43|Q45|Q77|Q79|Q96|Q114&format=json&props=labels|claims&languages=en|fr
  • 从每个国家/地区的数据中,您可以查找注册为行政分区的实体 (P150),并对这些新实体重复操作。

  • 或者,您可以使用tree命令获取所有行政区划树。例如,对于法国 (Q142),则为 http://wdq.wmflabs.org/api?q=tree[142][150] Tadaaa,36994 项!但考虑到从一个国家到另一个国家可能会遇到不同类型的分割,要细化这一点要困难得多。并避免从浏览器执行此类查询,它可能会崩溃。

  • 您现在只需通过使用claim命令和相应的子类细化最后一个查询来按国家/地区查找城市 em>(P279) of municipality(Q15284) 实体 ( all available here ):对于法国,这是 commune (Q484170),因此您的请求如下所示

    http://wdq.wmflabs.org/api?q=tree[142][150] 并声明[31:484170]

    然后对所有国家重复一遍:玩得开心!

关于解析维基百科国家、地区、城市,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24696431/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com