gpt4 book ai didi

java - 如何从维基百科获取某些文本?

转载 作者:行者123 更新时间:2023-12-02 00:50:17 25 4
gpt4 key购买 nike

以此为例: http://en.wikipedia.org/wiki/United_States_Bill_of_Rights

在“修正案”部分下,我想了解每个要点的内容,并将它们显示在 Android 应用程序中的一个漂亮列表中。我知道有一个 wikimedia api,但我完全不知道如何使用它,根据我的理解,你可以获取某个部分下的文本,但我不确定你是否可以单独获取每个项目符号点。

最好的方法是什么?或者,我是否应该花时间将 300 多页的文本复制到文本文件中,然后在应用程序中读取它?

最佳答案

此链接使用 mediawiki API 查询您问题中的页面 ( based on this wiki article ):

http://en.wikipedia.org/w/api.php?action=query&prop=revisions&rvprop=content&format=xml&titles=United_States_Bill_of_Rights

可以看到,它返回一个xml文档,页面文本在<rev>下找到标签。它是 mediawiki 文本标记语言中的纯编辑器文本。

因此,要从该文本中提取信息,您应该使用解析。 Here is a list of alternative parsers ,有些是用Java编写的。

关于java - 如何从维基百科获取某些文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3522487/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com