mysql - 如何设计一个架构来处理定期批量插入/更新？-6ren

mysql - 如何设计一个架构来处理定期批量插入/更新？

转载作者：行者123 更新时间：2023-11-29 14:17:07

25

4

(tldr；我认为定期更新会强制表使用自然键。因此我必须迁移我的数据库架构。)

我有一个生产数据库，其中有一个像planets这样的表，尽管它具有良好的潜在自然键(例如，从未真正改变的行星名称)，但使用典型的递增整数作为主键。行星表有一个或两个自引用列，例如 *parent_planet_id*。

现在我正在构建基于离线云的工作人员，每周重新创建行星记录的子集，并且它们需要与主服务器集成。我的计划是:

工作实例具有迷你版本的数据库(相同架构，但没有行星记录)
工作线程每周启动一次，进行所有处理，创建大约 100,000 个行星记录，并导出数据。 (我认为导出格式对于这个特定问题并不重要:可能是 mysqldump、yaml 等)
然后，生产服务器导入记录:一些是新记录，大部分是更新记录。

这最后一步是我不知道如何解决的。我并不是每次都完全替换 Planets 表，所以问题是两个数据库都有自己的递增整数 PK。所以我不能只进行简单的导入。

我考虑过在没有 id 列的情况下导出，但后来我意识到自引用列会阻止这种情况。

我看到两种可能的解决方案:

重新设计架构以对行星表使用自然键。这会很痛苦。
使用 UUID 而不是 key 的递增整数。我想，搬到那里会更容易。 ID 是唯一的，并且可以安全地导入新行。这也避免了依赖键中的自然数据的问题。

最佳答案

修改Planets以使用替代层次结构技术，例如 nested sets 、闭包表或路径枚举然后导出。这将打破 ID 依赖性。

或者，如果您仍然不喜欢这个想法，请将导出和导入视为 ETL 问题。

在导出过程中修改记录以包含 PlanetName、ParentPlanetName
首先导入所有行星 (PlanetNames)
然后导入层次结构 (ParentPlanetName)

无论如何，第一个数据库中的代理键永远不应该离开该数据库——它在数据库之外没有任何意义。

关于mysql - 如何设计一个架构来处理定期批量插入/更新？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/12456137/

25

4

0

文章推荐： php - 使用 PHP 将文本文件读入数组 - 建议

文章推荐： android - Android游戏中的滑动棋子

文章推荐： android - 如何单击 ScrollView 后面的 View

文章推荐： mysql查询参数字符串数组

c# - 定期 WMI 查询导致内存泄漏？
我是 .NET 编程的新手，目前我正在开发一个计算机健康监控系统，该系统目前处于初级阶段。我将使用 C# 2010 并使用 WMI 查询来查询计算机信息。在进一步开发应用程序之前，我创建了一个迷你测
php - 定期 HTML 抓取
我正在考虑开发一个站点，服务器将定期抓取另一个站点，以便为我的数据库中的某些条目收集内容。我的问题如下... 如何让服务器及时执行抓取？你能让它执行 php 还是你用什么语言来执行抓取？有什么好的
android - 定期 JobScheduler 不遵守约束
使用 JobScheduler , 我设置了一个简单的 JobService如下: @TargetApi(21) public class SimpleJobService extends JobSe
java - 定期 JavaFX 服务
我想定期从我的 JavaFX 应用程序执行任务。该任务从远程流中提取数据。虽然我知道我可以按照下面的建议使用计时器: JavaFX periodic background task 我相信这应该能够
Git:定期 merge/重新设置长期存在的错误修复分支以掌握
上下文我们使用多个具有相同工作流程的 git 存储库，涉及两个分支，并且想知道如何最好地将一个提交“同步”到另一个。简单地说，我们的 git 存储库包含: 长寿枝两个分支: master(持续开
ios - 定期 iOS 后台位置更新
我正在编写一个需要以高精度和低频率进行后台位置更新的应用程序。解决方案似乎是一个后台 NSTimer 任务，它启动位置管理器的更新，然后立即关闭。之前有人问过这个问题: How do I get a
orchardcms - 从其他来源将内容同步到 Orchard CMS - 定期
我有一个包含产品的商业系统。产品被分类并且还具有属性组。我想同步/更新将来自商务系统的产品转换为在 Orchard 中定义的产品项目的内容类型，以便将数据从商务系统推送到 Orchard 内容项目。
Android:定期 UI 更新和通信服务 <-> Activity
所以我想做的只是按时间间隔更新 Activity 的 View ，比如每秒一次。在这个特定的例子中有几个按钮，我想要改变的只是它们的文本。我在这里阅读了很多解决相同问题的问题，但我似乎比其他人更容易陷
android - recyclerview 定期 ui 子更新
我有一个项目的 recyclerView，(除其他外)包含从 WS 检索的游戏持续时间的时间戳。为了显示比赛的持续时间，我必须获取当前时间戳，做垫子并将其转换为可读格式(例如:5 分钟 5 秒)。只有
mysql - 定期 Cloudbees MySql 备份
这可能是一个愚蠢的问题，但经过几个小时的谷歌搜索后我找不到合适的答案.. 我们有一个在 cloudbees 上运行的业务关键型应用程序。源代码已正确备份，我们希望我们的数据库也有相同的备份。 Clou
postgresql - 定期 RDS Postgresql 复制延迟
我一直在观察我的 PostgreSQL 只读副本显示复制滞后的周期性延迟。延迟似乎会增加到 30-40 分钟，然后自动下降到 0。这与 CPU 利用率相关，但它远未接近 CPU 限制。读取流量来自
mysql - keepalived + MySQL 定期 MISC_CHECK
我已完成 Keepalived + MySQL(master - master)设置。我将 MASTER 和 BACKUP 的优先级保持不变，因为我不希望它们开始频繁抖动(一次切换 VIP 就足够了
javascript - 定期 Ping 并在出错时显示 div
我目前有一个图像，如果本地内容可用，它会被 ping 以仅显示一个 div。但我认为更好的实现方式是以 30 秒为间隔定期检查 ping，如果图像未成功 ping，则显示 #offline div。
Android 定期 GPS 服务轮询，最大限度地延长电池生命周期
我正在尝试编写一项服务，该服务将每隔 X 分钟尝试获取设备的 GPS 位置，并在后台运行和记录，即使应用程序未处于焦点状态也是如此。那么，是时候创建服务了。我创建了一个服务，设置了 locatio
Android 定期 GPS 位置更新与服务内的 AlarmManager
我在这里阅读了很多问题，但无法弄清楚问题是什么。我正在为 Android 编写现场服务应用程序。在其中一个 Activity (MyActivity.java) 中，我有两个按钮:开始和停止。当现
git - 定期 git fetch 的副作用
假设我有这样的代码: git fetch && git diff origin origin/master --quiet || echo "untracked" 我希望它定期运行。比方说，每秒一次
java - Netty - 定期 HTTP 请求重用 channel
我想建立与 HTTPS 服务器(例如 google.com)的连接并定期获取新鲜内容。我编写了简单的 HTTP 客户端: public class AsyncLoader { private
android - 定期 wifi 扫描并将结果导出到 txt 文件
我想定期进行 wifi 扫描(可能每 5 分钟一次)并将结果导出到一个 txt 文件，以便它显示 AP SSID 和 MAC 以及接收到的信号强度。我是 Android 开发的新手，所以我只知道基础知
android - Workmanager(定期)获取位置和上传数据(Asynctask)被杀死
当手机处于 sleep 模式时，Workmanager 不会向我的服务器发送坐标。异步任务被杀死？我使用 Workmanager (PeriodicWorkRequest) 每 15 分钟获取一次坐
android - 定期 LogCat 轮询更新并保存到 SD 卡
目标收集 LogCat 的定期更新并将这些文本 block 保存(附加)到 SD 卡上的文件中问题 Log 类不提供自特定时间戳以来的更新可能的解决方案我的计划是定期运行类似于以下代码:htt

首页

博学

6Ren·AI

商城

mysql - 如何设计一个架构来处理定期批量插入/更新？