- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我想获取所有Wikipedia文章的所有标题的列表。我知道有两种可能的方法可以从Wikimedia支持的Wiki获取内容。一种是API,另一种是数据库转储。
我不想下载Wiki转储。首先,它很大,其次,我对查询数据库没有真正的经验。另一方面,API的问题是我无法找出一种仅检索文章标题列表的方法,即使它需要> 4个mio请求,也可能使我无法再进行任何其他请求。
所以我的问题是
最佳答案
The allpages
API module允许您执行此操作。它的限制(当您设置aplimit=max
时)为500,因此要查询所有4.5M文章,您将需要大约9000个请求。
但是转储是一个更好的选择,因为存在许多不同的转储,包括 all-titles-in-ns0
,顾名思义,它包含您想要的内容(59 MB的压缩文本)。
关于mediawiki - 如何获取所有Wikipedia文章的标题列表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24474288/
我有很多文本文件要上传到运行 MediaWiki 的 wiki。 我什至不知道这是否真的可能,但我想试一试。 每个文本文件的名称将是 wiki 页面的标题。 一个 wiki 页面对应一个文件。 我想从
是否可以使用 SyntaxHighlight GeSHi 在 MediaWiki 中缩进一段代码? ? 比如我希望下面的代码容器与三级列表对齐 * This is plain text of a fi
是否可以在 MediaWiki 中定义可缩进和可折叠的文本或代码块(例如,使用语法高亮格氏格式化)? 我在 Wikipedia 中看到了可折叠的表格和列表,并希望将相同的概念应用于段落和代码片段。 谢
mediawiki 数据库中的哪个表保存页面内容?我想直接访问 mediawiki 的数据库。 最佳答案 您可以查看database layout媒体维基。页面内容位于表格text (在 Postgr
在 MediaWiki 中,您可以使用变量(“Magic Word”),例如 {{PAGENAME}} 或 {{REVISIONDAY}} 获取与当前正在查看的页面相关的特定信息。是否有类似的变量(或
我正在尝试在 wiki 页面上放置一个对象列表,供多个团队标记他们使用的对象。为此,我为每个团队制作了一个带有一列的表格,并希望在这些列中放置一个复选框,以便团队进行标记。 这是我要做的事情的基本思想
有没有MediaWIki我可以在其中提交整个(可能非常大)mediawiki 文本(用于维基百科文章)的 API,这将给我提供与在 wikipedia 上查看的 HTML 文章完全相同的 HTML对于
有没有MediaWIki我可以在其中提交整个(可能非常大)mediawiki 文本(用于维基百科文章)的 API,这将给我提供与在 wikipedia 上查看的 HTML 文章完全相同的 HTML对于
我正在寻找一种方法来防止所有用户在 Mediawiki 中更改他们的密码(因为帐户创建和密码更改由中央 SSO 服务器处理)。 据我所知,Mediawiki 用户可以通过两种方式更改密码:使用登录页面
背景: 我与一个大型协作机构合作,该机构将大量文档集中在一个 wiki 结构中。我已经熟悉 wiki 标记,并且可以创建带有链接等的简单页面。 我合作的 wiki(基于 mediawiki 架构)的一
我正在运行一个 MediaWiki 实例,在撰写本文时我刚刚将其升级到最新版本 1.32.0。这个 wiki 已有近 10 年的历史,并且经历了多次升级。 这是一个法语维基,对于说法语的人来说,令人讨
通过访问 sysop 和数据库访问,我如何更改与用户关联的电子邮件地址? 数据库中的用户表将所有内容都编码为 BLOB。如果我可以解码和编码这些值,大概我可以更新 user.user_email。 最
MediaWiki 支持的侧边栏的默认左侧边栏包含诸如“随机页面”和“当前事件”之类的链接。我想隐藏这些。 除了使用 CSS ( display:none; ) 之外,还有其他方法可以做到这一点吗?
如何设置才能让 MediaWiki 不允许一个电子邮件地址创建多个帐户?垃圾邮件机器人仅使用一封电子邮件创建了 5 个帐户。 我一直在寻找配置设置或扩展,但没能找到。 与此相关的一个问题是使用类似于
我有一个包含不同类型类别的 mediawiki。 如果一个页面有 2 个类别 [[Category:Pear]][[Category:Strawberry]]) 我想添加第三个类别 [[Categor
我们的网络上有自定义协议(protocol),可以在我们的应用程序中打开窗口。我们想在我们的 Wiki 中放置此应用程序的链接,但 mediawiki 似乎唯一识别的协议(protocol)是 htt
我想在 mediawiki 中找到图像的确切 URL 以发送到我的 pinterest 代码中。要查找页面 URL,我使用 urlencode($wgTitle->getFullURL()) 但我无法
我不太确定这在 MediaWiki 中是否可行。 我有几个类别,每个类别包含几页。如果您打开一个类别页面,您将看到该类别的内容,通常由以下三个部分组成: 用户定义的文本(可以使用编辑链接进行编辑)。
我开发了一个应用程序,它在 mediawiki 站点上有一个手册/帮助系统。当用户在应用程序中需要帮助时,他/她可以点击一个按钮,访问维基上相应的帮助页面。这工作得很好,当我在应用程序中添加/更改功能
我刚刚安装了 Mediawiki 并意识到为新手配置它非常复杂。 作为我的第一个条目,我想更改字体颜色: {{ font color | green | green text }} 为此,我从 Wik
我是一名优秀的程序员,十分优秀!