r - 使 Spark 函数可以从 mutate 中的定制函数中访问

转载作者：行者123 更新时间：2023-12-04 03:09:35

24

4

同时通过 sparklyr 使用 Spark RDD ，我想包装一些常见的转换，以便更方便地将它们传递给 mutate 语法。

例子

例如，在处理具有以下时间戳的数据时:

2000-01-01 00:00:00.0
2000-02-02 00:00:00.0

我可以使用以下语法将它们转换为更有用的 YYYY-MM-dd 格式:

mutate(nice_date= from_unixtime(unix_timestamp(bad_timestamp), 'YYYY-MM-dd'))

挑战

因为我经常这样做，所以我想包装 from_unixtime(unix_timestamp(bad_timestamp), 'YYYY-MM-dd')) 调用并使用语法:

mutate(nice_date = from_unix_to_nice(bad_date))

常规方法建议编写一个函数:

from_unix_to_nice<- function(x) {
    from_unixtime(unix_timestamp(x), 'YYYY-MM-dd')
}

问题

应用函数失败时:

> Error: org.apache.spark.sql.AnalysisException: undefined function
> from_unix_to_nice; line 2 pos 62  at
> org.apache.spark.sql.hive.HiveFunctionRegistry$$anonfun$lookupFunction$2$$anonfun$1.apply(hiveUDFs.scala:69)
>   at
> org.apache.spark.sql.hive.HiveFunctionRegistry$$anonfun$lookupFunction$2$$anonfun$1.apply(hiveUDFs.scala:69)
>   at scala.Option.getOrElse(Option.scala:120)

我如何方便地为常见的变异操作开发包装器，以便将它们传递给 sparklyr 管道？

最佳答案

问题是该函数需要以未计算的方式传递给 mutate() 函数。 rlang 包可以完成这个，这里是一个例子:

library(rlang)
library(sparklyr) 
library(nycflights13)
library(dplyr)

sc <- spark_connect(master = "local")

just_time <- flights %>%
     select(time_hour) %>%
     mutate(time_hour = as.character(time_hour))
     head(100)

spark_flights <- copy_to(sc, just_time, "flights")


from_unix_to_nice<- function(x) {
  x <- enexpr(x)
  expr(from_unixtime(unix_timestamp(!!x), 'YYYY-MM-dd'))
}

from_unix_to_nice(test)


spark_flights %>%
  mutate(new_field =  !!from_unix_to_nice(time_hour))

from_unix_to_nice() 函数现在传递:from_unixtime(unix_timestamp(test), "YYYY-MM-dd") 到 mutate() 就好像您会输入准确的语法一样。

关于r - 使 Spark 函数可以从 mutate 中的定制函数中访问，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/46318820/

24

4

0

文章推荐： ZSH 完成基于之前的标志

文章推荐： python - PEP 484 : exclusive type for type hint

文章推荐： c - 为什么 fopen 在 main( argv[]) 给定值时失败

文章推荐： wcf - 如何在回调方向扩展 WCF？

vue.js - Nuxt 错误 : [vuex] Do not mutate vuex store state outside mutation handlers when mutating from plugin
我在 Nuxt 项目旁边使用 Firebase，在下面的插件中，我调用 onAuthStateChanged 来检查用户是否已经登录，如果他是，我设置用户状态并将他重定向到仪表板如下: import
r - mutate `:=` 和 mutate `=` 之间的 tidyeval 差异
这两个代码块都可以工作，即使它们使用不同的等号，一个使用 :=，另一个使用 =。哪个是正确的，为什么？我认为 tidyeval 在使用 dplyr 函数时需要 := ，但奇怪的是 = 在我的 muta
c++ - 是否可以在 C++ 的 Mutator 中使用 Mutator？
下午好! 我做了一些快速搜索，我很难弄清楚我应该如何去做我需要做的事情。对于这个程序，我们正在创建一个基本的工作票类。每个属性都有自己的修改器和访问器，但除此之外还有一个修改器将所有属性作为参数并一
php - Laravel 5 - 分形更改器(mutator) - 将参数发送到更改器(mutator)以缩小响应范围
所以我有一个名为 VIP 的模型，其中包含大量相关信息。因此，当我们转到路线 vip/{id} 时，我会返回大部分信息。但是，当我转到 vips/{per-page} 时，我不想返回所有数据，因为 A
javascript - Vuex和mysql连接对象: Do not mutate vuex store state outside mutation handlers
我有一个电子应用程序，它使用 mysql 包直接连接到我的数据库。我想做的是将使用 mysql.createConnection() 创建的 connection 对象存储在 Vuex 状态中。然后我
C++ : Suggest names for mutating and non-mutating versions of a member function
假设我有一个 Image 类，我想提供一些图像操作，比如缩放、旋转等。我想为每个操作提供两种类型的功能。一种修改对象，另一种不修改。在 Ruby 中，有些函数以 !并指出这个将修改参数。因为这在 C
javascript - DOM Mutation Observers 是否比 DOM Mutation Events 慢？
以下代码利用 DOM 突变事件 DOMNodeInserted检测 body 的存在元素并包裹它的 innerHTML放入 wrapper 中。 functi
vuejs2 - Vuex - 'do not mutate vuex store state outside mutation handlers'
我正在尝试从 Firestore 初始化我的 Vuex 商店。最后一行代码 context.commit('SET_ACTIVITIES', acts) 是产生错误的原因。我不认为我在直接改变状态，因
javascript - 尝试从 indexedDB 中的对象存储中删除对象时出现错误 "A mutation operation was attempted on a database that did not allow mutations."
所以基本上我已经阅读了相当多的教程、演示和 API 规范本身，但并没有深入了解，非常感谢你们的帮助。我最近一直在努力更好地掌握 IndexedDB，但遇到了一些问题，希望对这段代码提出一些批评/反馈
javascript - 在 indexedDB 中检索数据时出现错误 "A mutation operation was attempted on a database that did not allow mutations."
我有这个简单的示例代码: var request = mozIndexedDB.open('MyTestDatabase'); request.onsuccess = function(event){
javascript - .push end 位于 "Do not mutate vuex store state outside mutation handlers"
我定义了一个 Vuex 存储( Action 、状态、突变和 getter) 当我在突变中向状态数组添加新的待办事项时，出现以下错误:错误:[vuex] 不要在突变处理程序之外改变 vuex 存储状态
vue.js - 更好的方法处理 : 'Do not mutate vuex store state outside mutation handlers' errors
事前:我的应用程序按预期工作，但我想知道是否有更好的方法来解决我遇到的问题。情况:我有一个项目，目前正在实现权限系统。当前的流程是加载特定对象(在本例中让我们采用 user)，然后注入(inject
swift 4 : "cannot use mutating member on immutable value: ' self' is immutable"in mutating function
这段代码 extension Collection { mutating func f() { removeFirst() } } 处理错误 cannot use mutating m
r - 在 R 和 dplyr 中，使用 "mutate"和 "mutate"将多次调用 "across"替换为一次调用
我们在 R 中有以下数据框 # Create example dataframe df % dplyr::mutate(col1A = ifelse(gp == 0, col1B, col1A))
vue.js - nuxt 应用程序中的 Vuex 抛出 "Do not mutate vuex store state outside mutation handlers"!
在我的 NUXT 应用程序中，我正在使用 vuex 存储模块!当我运行应用程序并调用时 this.$store.dispatch('userStore/setLoggedInUser',current
r - "Error in UseMethod("mutate ") : no applicable method for ' mutate ' applied to an object of class "function"尝试分隔列时
所以我有这个数据集 # A tibble: 268 x 1 `Which of these social media platforms do you have an account in ri
VUEX使用学习三:mutations
转载请注明出处：　　在 Vuex 中 store 数据改变的唯一方法就是提交 mutations 。 mutations 里面装着一些改变数据方法的集合，这是Vuex 设
r - 在使用变量调用的函数中实现 mutate
我想用不同的变量多次调用一个函数，每次都为数据框中的一个新变量设置一个值。这是我失败的尝试。感谢您的帮助! dat % mutate({{var3}} := ifelse({{var1}} >
r - 如何在列表中使用 mutate？
改变列表的正确方法是什么？在这种特定情况下，列表由 split 返回。 library(dplyr) csv%split(.,.$participant_number)%>%mutate(.,var(
mutation-testing - 哪些编程语言可以支持变异测试？
在某些语言中比其他语言更难(或不可能)实现变异测试吗？例如，是否可以在功能编程语言中实现变异测试？最佳答案我看不出任何语言都无法做到的任何理由。我当然不是专家，但是我认为使用功能语言进行突变测试

首页

博学

6Ren·AI

商城

r - 使 Spark 函数可以从 mutate 中的定制函数中访问

例子

挑战

问题