wikipedia - wikipedia Pageid 到 wikidata id 映射是否有任何转储？-6ren

wikipedia - wikipedia Pageid 到 wikidata id 映射是否有任何转储？

转载作者：行者123 更新时间：2023-12-03 20:33:39

25

4

本页:http://wikidata.dbpedia.org/downloads/20160111/
有一个名为 wikidatawiki-20160111-page-ids.ttl.bz2 的转储
其中包含 Wikidata id 到他们所谓的 wikipage id。 wikipage id 似乎与 Wikipedia pageid 不同。

例如德国:

维基百科页面 ID = 11867

维基数据 id = Q183 和维基页面 id = 322。

所以基本上这个转储将 Q183 映射到 322，而我需要将 Q183 映射到 11867。

作为引用: https://en.wikipedia.org/w/index.php?title=Germany&curid=11867 URL 中的 curid 代表 Wikipedia 页面 id。

是否有任何具有 Wikidata id 和 Wikipedia pageid 的等效转储文件？ (我不想使用 API 并像下面这样一一循环我的维基百科页面 ID: https://en.wikipedia.org/w/api.php?action=query&prop=pageprops&format=xml&pageids=11867)

编辑:我不确定 waht 是否正是 wikipage id，但在我在问题中提到的转储顶部可能有一个 wikipageId 到 Wikipedia pageid 映射文件。

最佳答案

我创建了一个 Python 包和命令行工具来处理名为 wikimapper 的问题。 .可以通过pip install wikimapper安装.它使用 Wikipedia SQL 转储来创建一个索引，然后可以使用该索引以非常快的速度进行多次映射(比 Wikidata SPARQL 端点快得多)。您可以使用我的 precomputed indices 之一并使用这个 sqlite3 数据库或使用包将 Wikipedia 页面标题/Wikipedia URL 映射到 Wikidata ID，反之亦然。使用页面名称或 URL 代替内部 Wikipedia ID 应该更舒服。

关于wikipedia - wikipedia Pageid 到 wikidata id 映射是否有任何转储？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/38398893/

25

4

0

文章推荐： R ggplot2 scale_y_continuous : Combining breaks & limits

文章推荐： php - Woocommerce 创建自定义变量产品类型

文章推荐： entity-framework-core - 如何更新现有的断开连接的实体

wikidata - Wikidata-SPARQL查询的请求限制
对Wikidata的查询是否有限制(仅SPARQL查询，不能编辑)？我找不到与此有关的任何官方文档。我想知道每分钟/小时(和每个IP地址)对查询的限制程度如何。最佳答案是的，有限制。当前，单个查
wikidata - 在 Wikidata api 中设置查询超时
我已经使用说明创建了 wikidata api 的本地版本 here ，我想指定一个自定义超时来覆盖 official api 中的 60 秒超时。。我在 RWStore.properties 中没
sparql - 通过 SPARQL 获取 Wikidata 实体描述，无需 Wikidata 标签服务
我在 opendata.stackexchange.com 上找到了以下代码片段, 它从维基数据中返回美国公民的姓名和描述: prefix wdt: prefix wd: PREFIX wikib
wikidata - 如何获取所有维基数据属性的列表？
什么是维基数据 API 等价于 this page其中列出了所有已知的维基数据属性？我想搜索一个属性，例如“博士生导师”，拿回P184。 items 也有类似的功能，但我似乎找不到属性的等效项。最佳
wikidata - 来自名称的Wikidata实体值
是否有一种方法可以根据实体名称获取Wikidata页面信息，例如，如果我想获取Google的页面数据。我认为必须使用带有相应实体值的“实体”来完成，但是我不确定是否有任何简单的方法来确定实体值。最
wikidata - 获取维基数据页面上的声明顺序
我请求有关维基数据实体的数据(API 操作 wbgetentities)，并且我需要与实体的维基数据页面上的声明顺序相同。我探索了所有返回的 JSON，但没有找到对它们进行排序的属性。即使在原始 AP
wikidata - 维基数据更新期间出错
我已经使用说明创建了 wikidata api 的本地版本 here ，并在使用默认选项运行 munge.sh 后，我运行了./runUpdate.sh -n wdq 导致出现以下错误消息。 ERRO
wikidata - 获取某些属性的使用值列表
我可以获取某些属性的使用值列表吗？例如，我想获取 P166(已获奖)属性的所有已使用不同值的列表。最佳答案更新 :感谢 Wikidata 查询服务，这现在是一个微不足道的操作，您可以向其发送 SP
wikidata - 如何对维基数据条目进行分类？
我正在尝试将项目分类为维基数据支持的主要类别:通用、人物、组织、事件、作品、术语、地点、其他。此处列出了这些类别: https://www.wikidata.org/wiki/Wikidata:Lis
sparql wikidata 标识符引用
我使用 KMDb 人员 ID 从 wikidata 数据库中检索信息。结果是包含三个 IMDB 代码的三行。如果我查看女 Actor wikidata 网页 (https://www.wikida
sparql - Wikidata api如何根据维基百科页面id获取一些属性
所以我有这个页面 ID 12517871:https://fr.wikipedia.org/wiki?curid=12517871 我想从这里的底部获取标识符 https://www.wikidata
database - wikidata 获取带有标签和项目值的所有属性
我的问题是如何从 wikidata 最好通过 SPARQL 提取所有属性及其各自的标签，这些标签也在网页上呈现。以 Google 为例维基数据上的条目。对于属性 P414(证券交易所)或 P159，
sparql - 如何仅从 Wikidata 属性中获取最新值？
假设我想获得每个国家 (Q6256) 及其最近记录的人类发展指数 (P1081) 值的列表。该国家/地区的人类发展指数属性包含在不同时间点获取的数据点列表，但我只关心最新数据。此查询将不起作用，因为它
json - 从 Wikidata 获取可读结果
好的，我正在尝试从 Wikidata 中获取有关电影的信息，以这部电影为例:https://www.wikidata.org/wiki/Q24871 在页面上，数据以可读的格式清晰显示，但是当您尝试通
scala - 从文本中高效提取 WikiData 实体
我有很多文本(数百万)，字数从 100 到 4000 不等。这些文本被格式化为书面作品，带有标点符号和语法。一切都是英文的。问题很简单:如何从给定文本中提取每个 WikiData 实体？实体被定义
java - 查询 Wikidata 的实体类型
我想根据维基百科页面的 Freebase 获取类型。例如，对于 Jeb Bush 我应该得到， Politician, Organization leader, Organization founde
javascript - 如何从 Wikidata API 读取数据响应？
我正在制作一个 ReactJS 应用程序，以在人们搜索时显示有关其的信息。我正在尝试使用 MediaWiki 从维基百科获取有关某人的信息。我正在进行 API 调用，但响应非常奇怪。我在 API 响应
sparql - 在 Wikidata-SPARQL 中使用限定符
我是 SPARQL/Wikidata 的新手，正在尝试弄清楚如何询问安吉丽娜·朱莉 (Angelina Jolie) 开始与她的配偶约会的时间。我在朱莉的维基数据条目中看到了信息，但我无法形成有效的
包含 Wikidata 上的子查询的 SPARQL 查询给出了意外结果
我知道以下 SPARQL 针对 Wikidata SPARQL Endpoint查询毫无意义。我的应用程序中会自动生成类似的查询。请忽略概念的合理性，让我们深入研究这个奇怪的(至少对我来说)发生的事情
python - 如何使用 pywikibot 登录 wikidata
我正在尝试使用 pywikibot 访问 wikidata 中的数据。我尝试使用数据对象的名称而不是代码来执行此操作。当我运行这个脚本时: import pywikibot site = pywiki

首页

博学

6Ren·AI

商城

wikipedia - wikipedia Pageid 到 wikidata id 映射是否有任何转储？