gpt4 book ai didi

wikipedia - wikipedia Pageid 到 wikidata id 映射是否有任何转储?

转载 作者:行者123 更新时间:2023-12-03 20:33:39 25 4
gpt4 key购买 nike

本页:http://wikidata.dbpedia.org/downloads/20160111/
有一个名为 wikidatawiki-20160111-page-ids.ttl.bz2 的转储
其中包含 Wikidata id 到他们所谓的 wikipage id。 wikipage id 似乎与 Wikipedia pageid 不同。

例如德国:

  • 维基百科页面 ID = 11867
  • 维基数据 id = Q183 和维基页面 id = 322。

  • 所以基本上这个转储将 Q183 映射到 322,而我需要将 Q183 映射到 11867。

    作为引用: https://en.wikipedia.org/w/index.php?title=Germany&curid=11867 URL 中的 curid 代表 Wikipedia 页面 id。

    是否有任何具有 Wikidata id 和 Wikipedia pageid 的等效转储文件? (我不想使用 API 并像下面这样一一循环我的维基百科页面 ID: https://en.wikipedia.org/w/api.php?action=query&prop=pageprops&format=xml&pageids=11867)

    编辑:我不确定 waht 是否正是 wikipage id,但在我在问题中提到的转储顶部可能有一个 wikipageId 到 Wikipedia pageid 映射文件。

    最佳答案

    我创建了一个 Python 包和命令行工具来处理名为 wikimapper 的问题。 .可以通过pip install wikimapper安装.它使用 Wikipedia SQL 转储来创建一个索引,然后可以使用该索引以非常快的速度进行多次映射(比 Wikidata SPARQL 端点快得多)。您可以使用我的 precomputed indices 之一并使用这个 sqlite3 数据库或使用包将 Wikipedia 页面标题/Wikipedia URL 映射到 Wikidata ID,反之亦然。使用页面名称或 URL 代替内部 Wikipedia ID 应该更舒服。

    关于wikipedia - wikipedia Pageid 到 wikidata id 映射是否有任何转储?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38398893/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com