snowflake-cloud-data-platform - SnowFlake 中的合并语句似乎写入了太多行。有没有办法改善这种情况？-6ren

snowflake-cloud-data-platform - SnowFlake 中的合并语句似乎写入了太多行。有没有办法改善这种情况？

转载作者：行者123 更新时间：2023-12-04 12:27:24

25

4

在 Snowflake 中，我正在执行一个基本的合并语句来更新表中的一组行。该表有 1B 行，大小为 160GB。该表使用 TenantId 列作为聚类键进行聚类。此列有 10k 个不同的值，分布相当均匀。
我正在合并的数据只是更新，包括 100 万条记录，针对这些租户 ID 的子集(~500)。合并根据 TenantId(目标的集群键)和记录 ID 将此源连接到目标。
合并的结果正确列出了更新的行数，但花费的时间比我预期的要长。如果我查看查询执行详细信息，我会看到计划中的合并操作(与表扫描/连接相比几乎占用所有时间)具有“扫描的字节数”和“写入的字节数”都等于 160GB 大小我的 table 。
写入的字节似乎与那里有关。有没有办法让它将写入集中在与被触摸的记录相关的微分区上？似乎不需要写出表格的完整大小。
表的簇深度:1.0208
表的簇信息:
{
"cluster_by_keys": "LINEAR(TENANTID)",
“total_partition_count”:29827，
“total_constant_partition_count”:29646，
“average_overlaps”:0.0323，
“平均深度”:1.0208，
“partition_depth_histogram”:{
“00000”:0，
“00001”:29643，
“00002”:19，
“00003”:49，
“00004”:55，
“00005”:17，
“00006”:9，
“00007”:25，
"00008": 5,
"00009": 5,
“00010”:0，
“00011”:0，
“00012”:0，
“00013”:0，
“00014”:0，
“00015”:0，
“00016”:0
}
}

最佳答案

您必须了解底层发生的事情以及微分区如何工作才能了解正在发生的事情。
雪花表看起来是可变的(允许更新)，但在它下面由不可变的文件组成。当对现有记录执行更新时，代表该记录的文件将作为更新前先前状态的记录写入时间旅行。并将新记录写入事件微分区；没错，更新将创建微分区，那些对事件微分区可见的和现有的致力于时间旅行。
这就是为什么仅插入建模和架构范式比那些允许更新的范式高效得多。即使在传统 RDBM 中更新也是昂贵的操作，而在大数据平台中这几乎是不可能的。
是的，Snowflake 支持更新，但是否有效使用平台取决于您，是的，甚至包括您在平台上建模的方式。

关于snowflake-cloud-data-platform - SnowFlake 中的合并语句似乎写入了太多行。有没有办法改善这种情况？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/69586840/

25

4

0

文章推荐： typescript - FP-TS 分支(面向铁路的编程)

文章推荐： javascript - sortablejs 在第二次 dragStart 上更改顺序

文章推荐： web3js - 使用 Web3.js 获取从特定地址收到的 token 总量

.net - 有没有.Net云平台
就目前而言，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the he
xcode - 有没有[转到文件...]？
在现代 IDE 中，有一个键盘快捷键可以通过键入文件名称来打开文件，而无需将手放在鼠标上。例如: Eclipse:Cmd|Ctrl + Shift + R -> 打开资源 IntelliJ:Cmd|C
c# - 有没有 "When"类型的东西？
有什么东西会等待事件发生(我正在等待的是 WebBrowser.DocumentCompleted)，然后执行代码吗？像这样: If (WebBrowser.DocumentCompleted) 不会
PHP 自动缩小。有没有？
我使用 PHP Minify，它很棒。但我的问题是，是否有任何 PHP 插件或其他东西可以自动检测 javascript/css 代码并自动缩小它？谢谢。最佳答案 Javascript 压缩器？看
windows - 有没有 'compiles'到windows批处理语法的脚本语言？
有没有一种语言，类似什么CoffeeScript是JavaScript，编译成windows batch|cmd|command line的语言？我指的cmd版本是基于NT的，尤其是XP sp3及以
ant - 有没有 Ant 任务可以复制不丢失权限
我知道我可以，但是，我真的宁愿有一个任务，我可以从任何可以使用所有(或至少大部分)属性的操作系统调用 copy ，但这并没有消除 unix 上的权限。我想知道是否已经有解决方案，或者我必须自己编
javascript - 有没有 jvectormap 的替代品
我正在使用 Vuejs(不使用 jQuery)开发一个项目，该项目需要像 jvectormap 这样的 map 但正如我所说，我没有使用 jQuery，那么是否有任何其他库可以在不使用 jQuery
jquery - 有没有 jQuery 投票插件？
想要进行一个简单的民意调查，甚至不需要基于 cookie，我不在乎投了多少票。有没有类似的插件或者简单的东西？最佳答案这是一个有用的教程 - 让我知道它是否适合您 using jQuery to
jquery - 有没有 jquery 下拉年份选择器
已结束。此问题正在寻求书籍、工具、软件库等的推荐。它不满足Stack Overflow guidelines 。目前不接受答案。我们不允许提出寻求书籍、工具、软件库等推荐的问题。您可以编辑问题，以便
iphone - 有没有 iPhone 友好的反馈服务
就目前情况而言，这个问题不太适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持，但这个问题可能会引发辩论、争论、民意调查或扩展讨论。如果您觉得这个问题可以改进并可能重新开放，visit
delphi - 有没有 "Pos"函数来查找字节？
var FileBuff: TBytes; Pattern: TBytes; begin FileBuff := filetobytes(filename); Result := Co
javascript - 有没有 "vqmod"允许多图片上传？
我想要一个 vqmod xml 文件来添加一次上传多个图像的功能。身边有这样的事吗？编辑:Opencart版本:2.1.0.1 最佳答案最后我写了一个xml来添加到opencart 2.1.0.1
java - 有没有 'clean' 方法来省略静态类型声明？
所以考虑这样的函数: public void setTemperature(double newTemperatureValue, TemperatureUnit unit) 其中Temperatur
arangodb - 有没有 arangoDB 的工具
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的，因为
r - 有没有 ggplot2 的美学表格或目录？
我是 ggplot2 的新手，一直在尝试找到一个全面的美学列表。我想我理解它们的目的，但很难知道哪些可以在各种情况下使用(主要是几何图形？)。 Hadley 的网站偶尔会在各个几何图形的页面上列出可用
php - 有没有 'fun'交互式主页的好例子？这里有关于创建此类交互性的教程吗？
就目前情况而言，这个问题不太适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持，但这个问题可能会引发辩论、争论、民意调查或扩展讨论。如果您觉得这个问题可以改进并可能重新开放，visit
javascript - 有没有 PHP 函数可以将数字转换为带有千位分隔符的货币？
是否有任何 PHP 函数可以将整数转换为十万和千万？ 900800 -> 9,00,800 500800 -> 5,00,800 最佳答案由于您已在问题标签中添加了 Yii，因此您可以按照 Yii
clojure - 有没有 Clojure 核心模块的惰性函数的完整列表？
使用 Clojure 一段时间后，我积累了一些关于它的惰性的知识。我知道诸如map之类的常用API是否是惰性的。然而，当我开始使用一个不熟悉的API(例如with-open)时，我仍然感到怀疑。是否
wpf - 有没有 AvalonDock 的更新替代品？
我的项目需要一个像 AvalonDock 这样的对接系统，但它的最后一次更新似乎是在 2013 年 6 月。是否有更多...积极开发的东西可以代替它？最佳答案 AvalonDock 实际上相当成熟并
clojure - 有没有 html 解析器来打嗝结构？
我正在寻找一个可以逆转 clojure 打嗝的函数所以 turns into [:html] 等等根据@kotarak的回答，这现在对我有用: (use 'net.cgrand.enliv

首页

博学

6Ren·AI

商城

snowflake-cloud-data-platform - SnowFlake 中的合并语句似乎写入了太多行。有没有办法改善这种情况？