gpt4 book ai didi

mysql - (大约)en.wikipedia页面链接表包含多少行?

转载 作者:行者123 更新时间:2023-11-29 18:59:36 26 4
gpt4 key购买 nike

我从enwiki-latest-pagelinks.sql.gz下载了dumps.wikimedia.org/enwiki/latest/转储。

我开始将表导入到mysql数据库中:

mysql -D wp_dump -u root -p < enwiki-latest-pagelinks.sql


完全导入该表似乎需要“永远”,它已经运行了两天,但是仍然有进步。

现在,该表中有7亿多行,而数据库表文件非常庞大,超过130G。

谁能告诉我当前 pagelinks表中有多少行(错误地)?这对我(并且我假设其他人)的计划会很棒。我在Wikipedia上或通过“咨询” Google找不到信息。

最佳答案

https://stats.wikimedia.org/EN/TablesDatabaseLinks.htm来看,2010年该数字约为3.3亿,此后该数据从未更新过。根据转储文件的大小,它肯定会达到数十亿。

由于在统计终止之前它以每月2%的速度增长,假设稳定增长,那么它将达到大约40亿

关于mysql - (大约)en.wikipedia页面链接表包含多少行?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43964149/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com