- xml - AJAX/Jquery XML 解析
- 具有多重继承的 XML 模式
- .net - 枚举序列化 Json 与 XML
- XML 简单类型、简单内容、复杂类型、复杂内容
我正在尝试从维基百科的信息框中获取数据到散列或其他东西中,以便我可以在我的 Ruby on Rails 程序中使用它。具体来说,我对 Infobox company 感兴趣和 Infobox person .我一直在使用的例子是“福特汽车公司”。我想获取该公司信息以及福特公司框中链接到的人员的个人信息。
我已经尝试从 Wikipedia API 中弄清楚如何做到这一点或 DBPedia但我运气不佳。我知道维基百科可以返回一些我可以用 ruby 解析的 json,但我一直无法弄清楚如何获取信息框。对于 DBPedia,我什至不知道如何查询它来获取福特汽车公司的信息。
最佳答案
我投票给 DBpedia。
一个简单的解释是:
dbpedia 命名方案是http://dbpedia.org/resource/WikipediaArticleName (唯一标识符),空格替换为 _
。
http://dbpedia.org/page/ArticleName (html 预览)和 http://dbpedia.org/data/ArticleName(.json/.jsod)是有关您想要的文章的信息的 JSON 表示形式。 (.rdf 等现在可能会让您感到困惑。)
对于福特汽车公司,您应该要求:
http://dbpedia.org/data/Ford_Motor_Company.json
或:
http://dbpedia.org/data/Ford_Motor_Company.jsod
(哪个对你来说更简单)
现在,根据文章类型、个人或公司,有不同的属性定义它们,这些属性取决于 dbpedia 本体 (http://wiki.dbpedia.org/Ontology)。
更高级的步骤可能是使用 SPARQL 查询来获取数据。
关于ruby - 以 Ruby 可以理解的格式获取维基百科信息框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4542612/
好吧,我看过一些帖子提到其他一些关于不使用 SP wiki 的帖子,因为它们很糟糕。 既然我们正在考虑在 SP 中创建 wiki,我需要知道为什么我们不应该让 6 名自动化开发人员来记录各种自动化流程
在 GitLab Wiki 部分,可以查看保存更改的历史记录。但是,当您单击提交链接时,它将显示该保存中存在的整个文件。有谁知道一种方法来区分提交以仅获取两个提交之间的差异? 这类似于它在 merge
我使用了 Wiki API 文档中的一些示例代码,但是当我输入搜索项时,没有任何反应。控制台中没有错误,什么也没有。如果我将 URL 输入到浏览器中,URL 本身就会起作用,所以我认为代码中的某些内容
我想在我的 wiki 中创建一个层次结构,如下所示: General FooPages Foo1 Foo2 Foo3 ODP Bar Baz 我想创建这些页
我正在尝试使用为 Python 制作的 Wikimapia 的 pymapia API,但无法理解如何正确使用它。 import pymapia as PyMapia a = PyMapia.PyMa
我正在开发适用于 iOS 的客户端应用程序,用于在 Mac OS X 服务器(Snow Leopard 和 Lion)上编辑内置的 Wiki/Blog。 看来我们可以使用 MetaWeblog 、At
我正在编写一些 URL 重写软件,我想从多个角度了解哪种 URL 方案更可取: 博客风格:my-chemistry-answer -- 为什么? -- (不可取,技术性) Wiki 风格:My_Che
我一直试图找到一种方法来在 Azure DevOps Wiki 中创建子页面的目录。我从其他 wiki 服务中找到了方法。 在 Confluence 中,他们有一个用于“ child 显示”的宏 我为
我是一名优秀的程序员,十分优秀!