apache-spark - 为什么 array_contains 在 SQL 中接受两个参数的列，但在数据集 API 中不接受？-6ren

apache-spark - 为什么 array_contains 在 SQL 中接受两个参数的列，但在数据集 API 中不接受？

转载作者：行者123 更新时间：2023-12-04 05:15:59

26

4

我一直在查看有关 array_contains 的问题和答案(和 isin )方法在 StackOverflow 上，我仍然无法回答以下问题:

为什么array_contains在 SQL 中接受列(引用)作为其参数，而标准函数不接受？

我可以理解，上述问题很容易被标记为“主要基于意见”或类似问题，因此让我将其改写为以下内容:

使用方法 array_contains标准函数所以它接受来自列的参数(值)？

scala> spark.version
res0: String = 2.3.0

val codes = Seq(
  (Seq(1, 2, 3), 2),
  (Seq(1), 1),
  (Seq.empty[Int], 1),
  (Seq(2, 4, 6), 0)).toDF("codes", "cd")
scala> codes.show
+---------+---+
|    codes| cd|
+---------+---+
|[1, 2, 3]|  2|
|      [1]|  1|
|       []|  1|
|[2, 4, 6]|  0|
+---------+---+

// array_contains in SQL mode works with arguments being columns
val q = codes.where("array_contains(codes, cd)")
scala> q.show
+---------+---+
|    codes| cd|
+---------+---+
|[1, 2, 3]|  2|
|      [1]|  1|
+---------+---+

// array_contains standard function with Columns does NOT work. Why?!
// How to change it so it would work (without reverting to SQL expr)?
scala> val q = codes.where(array_contains($"codes", $"cd"))
java.lang.RuntimeException: Unsupported literal type class org.apache.spark.sql.ColumnName cd
  at org.apache.spark.sql.catalyst.expressions.Literal$.apply(literals.scala:77)
  at org.apache.spark.sql.functions$.array_contains(functions.scala:2988)
  ... 49 elided

最佳答案

仅仅是因为没有人足够关心实现 (Column, Column) => Column变体。如果您检查源代码，您会发现设计中没有任何内容，这会阻止您创建一个，因为标准工作流程是隐藏非 Column文字的参数。

它甚至不是特别有特色。还有其他没有包装器的函数需要额外的 Column参数，包括但不限于不同的日期/时间处理函数和数学函数。

关于apache-spark - 为什么 array_contains 在 SQL 中接受两个参数的列，但在数据集 API 中不接受？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/50412939/

26

4

0

文章推荐： asp-classic - 经典ASP-何时使用Response.flush？

文章推荐： tfs-workitem - TFS 2010 排序允许值说明

php - 我需要在PHP中激活什么？接受 [
我正在本地编程应用程序，但是当我迁移到服务器时，使用此行出现解析错误: if(!is_array($data[array_keys($data)[0]])) 返回值: Parse error: syn
java - 接受/拒绝聊天客户端中的文件传输
关闭。这个问题是opinion-based 。目前不接受答案。想要改进这个问题吗？更新问题，以便 editing this post 可以用事实和引文来回答它。 . 已关闭 9 年前。 Improv
C++ Winsock - 接受()
我已经开始尝试用 C++ 学习 Winsock，但我遇到了一些问题。我首先遵循 MSDN 上的 Winsock 示例(一个基本的客户端-服务器)。 http://msdn.microsoft.com/
linux - 接受/轮询问题
我有一段使用 epoll 的代码，但它有问题。当我运行它时，它给出输出:服务器套接字()没问题......服务器绑定(bind)()没问题......3个4个接受:无效参数我在 ubuntu lin
php - 接受 $_GET 变量作为文件路径
我正在寻找一种方法来接受 $_GET 变量作为文件路径，例如 - /page/test将转换为 page.php?page=test .我已经搜索过，但找不到任何可以帮助我的东西，因此我在这里问。我
接受 float 和减号 (-) 符号的正则表达式
我想要一个只接受从 0 到 9 和减号的浮点数的正则表达式。请帮忙。最佳答案 ^[-+]?[0-9]*\.?[0-9]+$ ^ - 字符串开头 [-+]? - 0 或 1 符号指示符 [0-9]*
c - 接受\r\n输入C程序
请问如何接受\r\n无需将其更改为 \\r\\n , 与 fgets . 我想让程序翻译 \r\n到换行符而不是将其打印为字符串。当前代码: char buff[1024]; printf("Msg
cocoa - 接受 Dock 图标上的卷滴
我正在编写一个 Cocoa 应用程序，该应用程序需要在其 Dock 图标上接受已安装卷的滴落。它不是基于文档的；我打算将每个卷分派(dispatch)到 application:openFiles 中
SQLite 接受 SQL 语法中不存在的连接类型
我在 SQLite 中发现了这种意外行为。 SQLite 似乎接受 SQL 连接语法中的任意关键字。如果我不小心键入了 natural join 而不是 natural join，则会生成笛卡尔积。这
.net - 接受 Drop 时如何在文本框上移动插入插入符
我在 Windows 窗体的同一个窗体上有一个 TreeView 和一个多行文本框。我有拖放设置，以便我可以将节点从 TreeView 拖到文本框并将文本插入文本框(这是有效的)。我想增强这一点，以
javascript - 接受 D3 布局树中的通用嵌套对象
我正在创建一棵类似于 D3 Layout Tree 的树并尝试绑定(bind)我的自定义 JSON 对象。切换树节点的代码如下。 function toggleAll(d) { if (d.c
Symfony2 DateTime null 接受
所以，我希望能够向我的 DOB 字段发送空选项。这是我的表单生成器: ->add('birthDate', DateType::class, array( 'widg
Django 接受 GET 参数
错误可以在这里看到:http://djaffry.selfip.com:8080/ 我希望索引页接受参数，无论是 mysite.com/search/param_here 或 mysite.com/?
parsing - 接受 Scala 标识符的解析器？
我想知道标准 Scala 解析器组合器是否包含一个解析器，该解析器接受 Scala 语言本身也接受的相同标识符(如 Scala 语言规范第 1.1 节中所指定)。 StdTokenParsers 特征
java - 接受 ServerSocket 上的所有传入请求
我暂时使用以下行在我的 Android 手机上创建 ServerSocket: socketl = new ServerSocket(port, 0, InetAddress.getByName("1
ios - 接受 AppStore 应用程序在每台设备上崩溃
今天早上刚刚发布了一个应用程序，我在所有可能的设备和模拟器上测试了它，但是当我从商店下载它时，应用程序在启动时崩溃。我在很多设备和iOS版本上测试过，但结果都是一样的: Incident Identi
java - 接受 5 个名字并打印最长的名字？
我想要 5 个名字中最长的一个。我想我应该使用 compareTo() 方法或 length()？输出必须是这样的: enter 5 names : Joey Mark Catherine Zach
Java - 接受 Map 作为类中的参数
抱歉，我不熟悉泛型，我可以创建一个如下所示的泛型类: public class InfoField { } 上面的类可以接受如下值: , User> 但是我可以有接受 map 对象作为值的类吗？
excel - 接受 address() 并给出值的函数
我想让一个单元格等于它上面的单元格。当我写作时 =address(row()-1;column()) 它只是写入上面单元格的名称(例如，对于 B2，它写入 $B$1) 是否有一个函数可以输入地址并放
java - Asm ClassReader 接受
我正在使用Asm访问java字节码来获取方法信息。看来ClassReader类的accept方法是异步调用的，所以不可能立即获取方法信息。我该怎么办？最佳答案实际上，accept 方法是从您自己的

首页

博学

6Ren·AI

商城

apache-spark - 为什么 array_contains 在 SQL 中接受两个参数的列，但在数据集 API 中不接受？