apache-spark - partitionColumn、lowerBound、upperBound、numPartitions参数是什么意思？-6ren

apache-spark - partitionColumn、lowerBound、upperBound、numPartitions参数是什么意思？

转载作者：行者123 更新时间：2023-12-03 10:50:20

26

4

在 Spark 中通过 JDBC 连接从 SQL Server 获取数据时，我发现我可以设置一些并行化参数，例如 partitionColumn , lowerBound , upperBound , 和 numPartitions .我经历过spark documentation但无法理解。

谁能解释一下这些参数的含义？

最佳答案

实际上上面的列表遗漏了一些东西，特别是第一个和最后一个查询。

没有它们，您会丢失一些数据( lowerBound 之前的数据和 upperBound 之后的数据)。从示例中看不清楚，因为下限为 0。

完整列表应该是:

SELECT * FROM table WHERE partitionColumn < 100

SELECT * FROM table WHERE partitionColumn BETWEEN 0 AND 100  
SELECT * FROM table WHERE partitionColumn BETWEEN 100 AND 200

...

SELECT * FROM table WHERE partitionColumn > 9000

关于apache-spark - partitionColumn、lowerBound、upperBound、numPartitions参数是什么意思？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/41085238/

26

4

0

文章推荐： google-apps-script - 如何使用 Google App Script 检测移动用户？

文章推荐： jsf - 如何在 JSF 数据表中显示行索引

文章推荐： .net - 用于比较 .dll 和反汇编差异的工具？

ios - 无法形成范围与 upperBound < lowerBound
我正在尝试从如下所示的服务器响应中获取日期: "dateStart": "2019-08-21T14:54:03.285108Z", "dateEnd": "2019-09-20T06:15:03.2
Scala UpperBound 和 LowerBound 概念
下面是我试图运行的代码: class Student { def printDetails = println("I am a student") def printSomeOtherDeta
apache-spark - spark-jdbc连接中如何操作numPartitions、lowerBound、upperBound？
我正在尝试使用 spark-jdbc 读取 postgres 数据库上的表。为此，我想出了以下代码: object PartitionRetrieval { var conf = new Spa
apache-spark - partitionColumn、lowerBound、upperBound、numPartitions参数是什么意思？
在 Spark 中通过 JDBC 连接从 SQL Server 获取数据时，我发现我可以设置一些并行化参数，例如 partitionColumn , lowerBound , upperBound ,
java - 泛型:LowerBounded 通配符与 UpperBounded 通配符
我理解 PECS(生产者扩展，消费者 super )的概念，但对这些符号仍然感到困惑: public class PECSTest { public static void main(Stri
c++ - 保护 C++ 变量免于溢出？如果值小于任何数据类型的 UpperBound
我想保护我的变量免于存储溢出值。我正在计算树中每个级别和某些阶段的损失。它给出类似 4.94567e+302 的值；这个值正确吗？如果我将它(如最小值、最大值等)与任何其他值进行比较。它会给出正确
java - Java 中的集合和/或数组是否有正确的 upperBound 和 lowerBound？
已阅读 this question及其答案，我得出的结论是这两种算法没有标准实现。不过，首先要介绍一些背景知识: 我们大多数人都熟悉 binarySearch 。这个想法是，给定一个排序数组(或Col
swift - 为什么允许 CountableRange 具有相同的 lowerBound 和 upperBound？
let range = 3..<3 // lowerBound == upperBound Swift 标准库在多个地方使用这种类型的范围，例如在数组 insert(_, at:) 中方法。 Arra
ios - swift fatal error : Can't form Range with upperBound < lowerBound
我有一个类，我想用 for 循环在其中添加值。这是我的课: public class Expandable { public var name: String public var
ios - Swift4:如何解析 "Fatal error: Can' t form Range with upperBound < lowerBound”？(UI 中的持续时间延迟)
我尝试使用动画来关闭菜单，我决定在按下按钮时减小 UIScrollView 的大小，当大小减小到我想要的值时，然后将其隐藏。为了在某些时候根据我想要的用户界面完成任务，我使用了“时间延迟功能”(给定

首页

博学

6Ren·AI

商城

apache-spark - partitionColumn、lowerBound、upperBound、numPartitions参数是什么意思？