gpt4 book ai didi

ruby - 以 Ruby 可以理解的格式获取维基百科信息框

转载 作者:数据小太阳 更新时间:2023-10-29 07:24:15 26 4
gpt4 key购买 nike

我正在尝试从维基百科的信息框中获取数据到散列或其他东西中,以便我可以在我的 Ruby on Rails 程序中使用它。具体来说,我对 Infobox company 感兴趣和 Infobox person .我一直在使用的例子是“福特汽车公司”。我想获取该公司信息以及福特公司框中链接到的人员的个人信息。

我已经尝试从 Wikipedia API 中弄清楚如何做到这一点或 DBPedia但我运气不佳。我知道维基百科可以返回一些我可以用 ruby​​ 解析的 json,但我一直无法弄清楚如何获取信息框。对于 DBPedia,我什至不知道如何查询它来获取福特汽车公司的信息。

最佳答案

我投票给 DBpedia。

一个简单的解释是:

dbpedia 命名方案是http://dbpedia.org/resource/WikipediaArticleName (唯一标识符),空格替换为 _

http://dbpedia.org/page/ArticleName (html 预览)和 http://dbpedia.org/data/ArticleName(.json/.jsod)是有关您想要的文章的信息的 JSON 表示形式。 (.rdf 等现在可能会让您感到困惑。)

对于福特汽车公司,您应该要求:

http://dbpedia.org/data/Ford_Motor_Company.json

或:

http://dbpedia.org/data/Ford_Motor_Company.jsod

(哪个对你来说更简单)

现在,根据文章类型、个人或公司,有不同的属性定义它们,这些属性取决于 dbpedia 本体 (http://wiki.dbpedia.org/Ontology)。

更高级的步骤可能是使用 SPARQL 查询来获取数据。

关于ruby - 以 Ruby 可以理解的格式获取维基百科信息框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4542612/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com