作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我想计算特定语言的 wiki 转储中的实体/类别,比如英语。对于初学者来说,很难找到/遵循官方文档。到目前为止我所了解的是我可以下载一个 XML 转储(我从所有可用的不同文件中下载什么),并解析它(?)以计算实体(文章主题)和类别。
此信息(如果有的话)很难找到。请提供一些关于我如何使用它的说明或我可以了解它的资源。
谢谢!
最佳答案
转储相当笨重:即使是“真实”的小转储也有 25G。由于 RDF 相当冗长,因此扩展到 >100G。所以我的一般建议是避免转储。
如果实在忍不住,https://wdumps.toolforge.org/dumps允许您仅使用所需的语言/属性/实体创建自定义的转储子集。
然后,逐行阅读并……对每一行做一些事情
关于wikipedia - 如何下载和使用维基百科数据转储?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63035431/
我正在为我的应用程序使用 Tank-Auth。我唯一的问题是激活和重置帐户密码。 用于登录、注册、注销;我对这些代码没有问题; $route['login'] = "/auth/login"; $ro
我是一名优秀的程序员,十分优秀!