gpt4 book ai didi

sparql - 维基数据结果按类似于 PageRank 的方式排序

转载 作者:行者123 更新时间:2023-12-02 04:03:50 24 4
gpt4 key购买 nike

在 Wikidata ( Wikidata SPARQL endpoint ) 中,是否有一种方法可以使用类似 PageRank 的内容对 SPARQL 查询结果进行排序?

SELECT DISTINCT ?entity ?entityLabel WHERE {
?entity wdt:P31 wd:Q5.
SERVICE wikibase:label {
bd:serviceParam wikibase:language "en" .
}
} LIMIT 100 OFFSET 0

我们能否指定一个字段来对结果进行排序,并且该字段表示顶部的实体比下面的实体更引人注目/重要/可识别?

最佳答案

看起来 PageRank 对于维基数据来说没有多大意义。显然,大类(class)和大集体将成为领导者。

此外,与 Web 链接不同,RDF 谓词可以从两侧“导航”;这只是一个设计问题,哪个 URI 是主语,哪个 URI 是客体。

但是,Andreas Thalhammer continues他的工作。排名前 10 的维基数据实体是:

<表类=“s-表”><标题>项目标签排名 <正文>Q729动物24996.770第三季度美国24772.450Q1360节肢动物16930.883Q1390昆虫16531.822Q35409家庭14403.091Q756植物14019.927Q142法国13723.484Q34740属13718.484第 16 季度加拿大12321.178Q159俄罗斯11707.160

不幸的是,维基数据页面排名并未在(同一)端点上发布,因此无法使用 SPARQL 查询它们。

<小时/>

幸运的是,人们可以自己找出某种等级。可能的选项是:

  1. 输出语句数量 ( precalculated );
  2. 附加链接数量 ( precalculated );
  3. 传入语句的数量(在下面的示例中,仅计算 truthy 语句)。

示例查询:

SELECT ?item ?itemLabel ?outcoming ?sitelinks ?incoming {
?item wdt:P463 wd:Q458 .
?item wikibase:statements ?outcoming .
?item wikibase:sitelinks ?sitelinks .
{
SELECT (count(?s) AS ?incoming) ?item WHERE {
?item wdt:P463 wd:Q458 .
?s ?p ?item .
[] wikibase:directClaim ?p
} GROUP BY ?item
}
SERVICE wikibase:label { bd:serviceParam wikibase:language "en" . }.
} ORDER BY DESC (?incoming)

Try it!

截至 2017 年 10 月,所有这些指标都或多或少相关。

scatterplot matrix

以下是欧盟成员国这些措施的相关系数。

<表类=“s-表”><标题> PIL 逊结果附加链接传入页面排名 <正文> 结果1.00000.69070.74160.8652 附加链接0.69071.00000.43140.5717 传入0.74160.43141.00000.8978 页面排名0.86520.57170.89781.0000
<表类=“s-表”><标题>斯 PIL 曼结果附加链接传入页面排名 <正文> 结果1.00000.68690.76190.8736 附加链接0.68691.00000.76800.8342 传入0.76190.76801.00000.8872 页面排名0.87360.83420.88721.0000
<表类=“s-表”><标题>肯德尔结果附加链接传入页面排名 <正文> 结果1.00000.49140.56610.7143 附加链接0.49141.00000.57640.6454 传入0.56610.57641.00000.7249 页面排名0.71430.64540.72491.0000

另请参阅:

关于sparql - 维基数据结果按类似于 PageRank 的方式排序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39438022/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com