gpt4 book ai didi

r - 我有一个有效的 mapply 函数 - 如何将其转换为 mlply?

转载 作者:塔克拉玛干 更新时间:2023-11-03 03:41:46 25 4
gpt4 key购买 nike

我编写了以下 R 代码,它将最近的邮政编码分配给一组北/东坐标:

# Set of northing / easting coordinates that I need to assign a postcode to
x1 <- c(1,2,4,6,7)
y1 <- c(5,2,4,7,8)

# Postcode with northing / easting coordinates
postcode <- c("Postcode A", "Postcode B", "Postcode C", "Postcode D")
x2 <- c(5,3,4,2)
y2 <- c(8,1,2,4)

# Function that attributes closest postcode to (x1, y1) coordinates
algo <- function(x, y)
{
dist <- which.min(sqrt(((x2 - x)^2) + ((y2 - y)^2)))
}

# mapply to run the function, and find the closest coordinates
postcode[mapply(algo, x1, y1, SIMPLIFY = T)]
[1] "Postcode D" "Postcode B" "Postcode C" "Postcode A" "Postcode A"

由于我有超过 500,000 个 (x1, y1) 坐标和超过 1,000,000 个 (x2, y2) 坐标,所以这个 mapply 函数运行时间很长,我想监控进度。我知道 mlply 有进度条功能,但我无法让它运行。我所做的是:

# Using mlply to run the function, and find the closest coordinates with progress bar
library(plyr)
postcode[mlply(cbind(x1, y1), .fun = algo, .progress = "tk")]

我做错了什么?希望 mlply(或其他 m*ply 函数)的正确 R 代码,以及上述不正确原因的解释。

非常感谢您的宝贵时间和关注。

最佳答案

我至少发现了两个问题。

首先,数据框中列的名称与函数中参数的名称不匹配。以下代码在没有警告的情况下运行。

mlply(cbind(x= x1, y =y1), .fun = algo, .progress = "tk")

其次,mlply 返回一个列表,其中包含不能用于对您的邮政编码向量进行子集化的元素:

mlply(.data = cbind(x = x1, y = y1), .fun = algo, .progress = "tk")

$1[1] 4

$2[1] 2

$3[1] 3

$4[1] 1

$5[1] 1

属性(“拆分类型”)[1] “阵列”属性(“拆分标签”) 坐标1 1 52 2 23 4 44 6 75 7 8

为了解决这个问题,我建议:

postcode[unlist(mlply(.data = cbind(x = x1, y = y1), 
.fun = algo, .progress = "tk"))[1:length(x1)]]

最后,如果您尝试寻找最小距离,您可以考虑直接寻找最小平方距离(您避免计算平方根一百万次,这应该会缩短时间)。

关于r - 我有一个有效的 mapply 函数 - 如何将其转换为 mlply?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36308984/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com