gpt4 book ai didi

mysql - 什么更快/更高效 : Continuous Deleting OR Continuous Updating + Intermittent Deleting?

转载 作者:行者123 更新时间:2023-11-29 06:21:18 26 4
gpt4 key购买 nike

我有一个运行多个行的 cron,删除“坏”的行(根据我的标准)。我只是想知道优化脚本的最佳方法是什么。我可以执行以下操作之一:

  1. 让同一个 cron 在发现“坏”行后立即删除它们。

  2. 让相同的 cron 立即将“坏”行更新为状态“1”,这意味着坏。然后,我可以设置另一个每小时运行一次的 cron,删除状态为“1”的所有行。为了使其更快,我想我应该在“状态”上有一个索引,但这也可能会破坏性能。

有什么建议吗?

最佳答案

具有两个可能值的字段上的索引并不像您想象的那么有用,特别是当您不断更改正在索引的字段时。举个例子,假设您有一个包含 100,000 行数据的表,并且最初每行的“状态”设置为 0(在删除周期之后和更新周期之前)。此时,使用该索引相当于对表进行顺序搜索。如果您更新 1,000 行,并将其状态标记为 1,那么您的索引将需要更新(并且可能需要重新平衡)1,000 次。最后,当您删除 status == 1 的所有行时,您将能够利用索引(您只查看 1% 的行),但您需要更新索引 1,000 次(在除了删除行之外)。

IMO,您最好直接选择“坏”行并立即删除它们 - 您可以消除未充分使用的索引的开销以及第二个查询的开销。

注意:根据您的数据库,删除操作可能非常快,也可能非常慢。最终,删除行涉及将行标记为未使用,然后将该行占用的空间返回到表中,以便可以插入新行。可变长度行(由于可变长度数据类型)和内部实现细节使这变得复杂。例如,PostgresQL 仅将一行标记为已删除,然后使用单独的手动调用进程(vacuum)将已删除行使用的空间返回到表以供新行使用。我相信 PostegresQL 仍然将行更新视为删除,然后是插入。 MySQL、Oracle 和 SQL Server 都有不同的方法来实现相同的最终结果,每种方法都会对系统性能产生更复杂的副作用。

您需要研究文档和任何性能指南来决定什么最适合您的系统。

关于mysql - 什么更快/更高效 : Continuous Deleting OR Continuous Updating + Intermittent Deleting?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3348988/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com