gpt4 book ai didi

r - 使用 broom 包整理 map 时保留区域名称

转载 作者:行者123 更新时间:2023-12-02 04:26:20 24 4
gpt4 key购买 nike

我正在使用栅格包中的 getData 函数来检索阿根廷 map 。我想使用 ggplot2 绘制生成的 map ,因此我使用 broom 包中的 tidy 函数转换为数据框。这工作正常,但我不知道如何保留联邦地区的名称,以便我可以在 map 上使用它们。

这是我的原始代码,不保留地区名称:

# Original code: ##################################
# get the map data from GADM.org and then simplify it
arg_map_1 <- raster::getData(country = "ARG", level = 1, path = "./data/") %>%
# simplify
rmapshaper::ms_simplify(keep = 0.01) %>%
# tidy to a dataframe
broom::tidy()

# plot the map
library(ggplot2)
ggplot(data=arg_map_1) +
geom_map(map=arg_map_1, aes(x=long, y=lat, map_id=id, fill=id),
color="#000000", size=0.25)

下面是从 SPDF 中提取地区名称并将其用作 map ID 的代码:

# Code with a hack to keep the district names: ################################
# get the map data from GADM.org and then simplify it
arg_map_1 <- raster::getData(country = "ARG", level = 1, path = "./data/") %>%
# simplify
rmapshaper::ms_simplify(keep = 0.01)

for(region_looper in seq_along(arg_map_1@data$NAME_1)){
arg_map_1@polygons[[region_looper]]@ID <-
as.character(arg_map_1@data$NAME_1[region_looper])
}

# tidy to a dataframe
arg_map_1 <- arg_map_1 %>%
broom::tidy()

library(ggplot2)
ggplot(data=arg_map_1) +
geom_map(map=arg_map_1, aes(x=long, y=lat, map_id=id, fill=id),
color="#000000", size=0.25)

我一直在想,一定有某种方法可以使用 tidy 函数来保留名称,但我怎么也想不出来。

最佳答案

您可以使用plyr包中的join函数。这是一个通用的解决方案(看起来很长,但实际上很简单):

  1. 加载 shapefile:假设您的工作目录中有一个 shapefile my_shapefile.shp。让我们加载它:

    shape <- readOGR(dsn = "/my_working_directory", layer = "my_shapefile")

    请注意,此 shape 文件内有一个数据框,可以使用 shape@data 访问该数据框。例如,此数据框可能如下所示:

    > head(shape@data)
    code region label
    0 E12000006 East of England E12000006
    1 E12000007 London E12000007
    2 E12000002 North West E12000002
    3 E12000001 North East E12000001
    4 E12000004 East Midlands E12000004
    5 E12000003 Yorkshire and The Humber E12000003
  2. 从 shapefile 创建新数据框:使用 broom 包来处理 shapefile 数据框:

    new_df <- tidy(shape)

这会导致类似这样的结果:

> head(new_df)
long lat order hole piece group id
1 547491.0 193549.0 1 FALSE 1 0.1 0
2 547472.1 193465.5 2 FALSE 1 0.1 0
3 547458.6 193458.2 3 FALSE 1 0.1 0
4 547455.6 193456.7 4 FALSE 1 0.1 0
5 547451.2 193454.3 5 FALSE 1 0.1 0
6 547447.5 193451.4 6 FALSE 1 0.1 0

不幸的是,tidy() 丢失了变量名称(在本例中为“region”)。相反,我们得到了一个新变量“id”,从 0 开始。幸运的是,“id”的顺序与 shape@data$region 中存储的顺序相同。让我们用它来恢复名称。

  • 使用行名称创建辅助数据框:让我们使用行名称创建一个新的数据框。此外,我们将添加一个“id”变量,与创建的 tidy() 相同:

    # Recover row name 
    temp_df <- data.frame(shape@data$region)
    names(temp_df) <- c("region")
    # Create and append "id"
    temp_df$id <- seq(0,nrow(temp_df)-1)
  • 使用“id”将行名称与新数据框合并:最后,让我们将名称放回到新数据框中:

    new_df <- join(new_df, temp_df, by="id")
  • 就是这样!您甚至可以使用join命令和“id”索引向新数据帧添加更多变量。最终结果类似于:

    > head(new_df)
    long lat order hole piece group id name var1 var2
    1 547491.0 193549.0 1 FALSE 1 0.1 0 East of England 0.525 0.333
    2 547472.1 193465.5 2 FALSE 1 0.1 0 East of England 0.525 0.333
    3 547458.6 193458.2 3 FALSE 1 0.1 0 East of England 0.525 0.333
    4 547455.6 193456.7 4 FALSE 1 0.1 0 East of England 0.525 0.333
    5 547451.2 193454.3 5 FALSE 1 0.1 0 East of England 0.525 0.333
    6 547447.5 193451.4 6 FALSE 1 0.1 0 East of England 0.525 0.333

    关于r - 使用 broom 包整理 map 时保留区域名称,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40576457/

    24 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com