- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
我刚刚被要求修复我们工作中的地址数据库,因为它非常慢,我通常不会靠近它,因为另一个人在看管它,但他现在已经离开了,所以这取决于我。
问题是数据库包含 5 个表,每个表中都复制了很多信息,应该有 2700 万行,但是有 3000 万行,所以有超过 300 万行重复,我们的老 IT 人员的方式设置是当有查询时它会搜索所有 5 个表,他使用 php 脚本清除重复的行,因此信息只显示一次。这大大减慢了我们的服务器速度,所以我写了一个 php 脚本来获取每一行并将其与其他 3000 万行进行比较,如果有重复项则删除它,但是在我启动它 2 分钟后服务器崩溃了所以我尝试了其他一些使用 php 的脚本,但是每次我尝试运行复杂的 mysql 查询时,服务器都会崩溃。
有没有一种不会使服务器崩溃的简单方法来合并所有表并删除所有重复的条目?
数据库副本
post1 10,044,279 MyISAM latin1_german2_ci 758.1 MiB -
post2 8,328,333 MyISAM latin1_german2_ci 624.7 MiB -
postcode 9,344,317 MyISAM latin1_german2_ci 703.8 MiB -
postcode_nw 1,157,217 InnoDB utf8_unicode_ci 97.6 MiB -
postcode_tmp 1,749,650 MyISAM latin1_german2_ci 50.5 MiB -
最佳答案
PHP 开发人员的一个常见问题是他们忘记了计算机中存在内存这样的东西。
它“闻起来”好像你试图将所有内容加载到内存中。
你的方法实际上是正确的,它会很慢,但安全。 如果您正确实现它。
您不关心速度,因为这是一次性的事情。
关于php - 处理海量 MySQL 表?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9446660/
“大规模”的微型 ORM 是否有处理继承的方法? robconery / massive 为 Massive 编写提供程序很难吗? 我需要非常接近 SQL Server 的东西。作为第一步,最好拦截
我编写了一个服务器可以使用的应用程序。此应用程序收集信息,并将其发送到服务器。每 10 秒执行一次。数据量取决于玩游戏的玩家,但让我们将其保持在大约 50 个服务器,每个服务器发送 100 条数据(每
我有一个表,其中包含 3 个字段(用户名、目标值、分数),由用户名 (~400,000) 和目标值 (~4000) 的完整交叉在外部生成,并计算出分数,导致总行数约为 16 亿. 我在这个表上的所有查
我们包括了这个 AndroidPdfViewer library支持在应用程序中查看 PDF 报告。它导致 APK 大小从 4.7Mb 大幅增加到 20.1Mb。 有没有办法减小这个尺寸。让我知道在哪
我在脑海中争论是否应该在 MySQL 中使用大量的多维数组或数据库。我正在为一个业务有很多产品的客户开发。在这个多维数组中,我将包括每个产品的产品标题、描述、图片链接和类别。 我的客户可能有 1000
我是一名优秀的程序员,十分优秀!