gpt4 book ai didi

R ggplot2 与 shapefile 和 csv 数据合并以填充多边形

转载 作者:行者123 更新时间:2023-12-04 08:52:20 25 4
gpt4 key购买 nike

我们每天制作 map ,显示我们地区 30 个不同区域的温度计算水平,每个区域根据水平填充不同的颜色。这张 map 看起来像

enter image description here

现在我想将 map 生成切换到 R。我已经下载了省和市边界(你可以找到 boundaries for whole Spain 或这里的 subset for my region )并设法在 Hadley 的 example 之后使用 ggplot2 绘制它们.

我还可以生成一个包含两列的 ascii 文件:标识符 (CODINE) 和每日级别。您可以下载here .

这是我第一个尝试使用 R 和 ggplot2 绘制 shapefile 的脚本,因此可能会出现错误,并且可以肯定它可以改进,欢迎提出建议。以下代码(基于前面提到的 Hadley)对我有用:

> require("rgdal")
> require("maptools")
> require("ggplot2")
> require("plyr")

# Reading municipal boundaries

esp = readOGR(dsn=".", layer="lineas_limite_municipales_etrs89")

muni=subset(esp, esp$PROV1 == "46" | esp$PROV1 == "12" | esp$PROV1 == "3")
muni@data$id = rownames(muni@data)
muni.points = fortify(muni, region="id")
muni.df = join(muni.points, muni@data, by="id")

# Reading province boundaries

prov = readOGR(dsn=".", layer="poligonos_provincia_etrs89")

pr=subset(prov, prov$CODINE == "46" | prov$CODINE == "12" | prov$CODINE == "03" )
pr@data$id = rownames(pr@data)
pr.points = fortify(pr, region="id")
pr.df = join(pr.points, pr@data, by="id")

ggplot(muni.df) + aes(long,lat,group=group) + geom_path(color="blue") +
+ coord_equal()+ geom_path(data=pr.df, +
aes(x=long, y=lat, group=group),color="red", size=0.5)

这段代码绘制了一张带有所有边界的漂亮 map enter image description here

对于按级别填充的多边形,我尝试按照 http://tormodboe.wordpress.com/2011/02/22/g%C3%B8y-med-kart-2/ 中的建议进行读取然后合并

level=read.csv("levels.dat",header=T,sep=" ")
munlevel=merge(muni.df,level,by="CODINE")



但它给出了一个错误

Error en fix.by(by.x, x) : 'by' must specify a uniquely valid column



我不熟悉 shapefile,也许我需要了解更多关于 shp 数据属性的信息,才能找到合并两个数据集的正确选择。如何合并数据以便绘制线条(市政边界)然后用级别填充?

最佳答案

[注意:这个问题是在一个多月前提出的,所以 OP 可能已经找到了一种不同的方法来解决他们的问题。我在处理 this related question 时偶然发现了它.包含此答案是希望对其他人有所帮助。]

这似乎是OP所要求的......



...并使用以下代码生成:

require("rgdal")
require("maptools")
require("ggplot2")
require("plyr")

# read temperature data
setwd("<location if your data file>")
temp.data <- read.csv(file = "levels.dat", header=TRUE, sep=" ", na.string="NA", dec=".", strip.white=TRUE)
temp.data$CODINE <- str_pad(temp.data$CODINE, width = 5, side = 'left', pad = '0')

# read municipality polygons
setwd("<location of your shapefile")
esp <- readOGR(dsn=".", layer="poligonos_municipio_etrs89")
muni <- subset(esp, esp$PROVINCIA == "46" | esp$PROVINCIA == "12" | esp$PROVINCIA == "3")
# fortify and merge: muni.df is used in ggplot
muni@data$id <- rownames(muni@data)
muni.df <- fortify(muni)
muni.df <- join(muni.df, muni@data, by="id")
muni.df <- merge(muni.df, temp.data, by.x="CODIGOINE", by.y="CODINE", all.x=T, a..ly=F)
# create the map layers
ggp <- ggplot(data=muni.df, aes(x=long, y=lat, group=group))
ggp <- ggp + geom_polygon(aes(fill=LEVEL)) # draw polygons
ggp <- ggp + geom_path(color="grey", linestyle=2) # draw boundaries
ggp <- ggp + coord_equal()
ggp <- ggp + scale_fill_gradient(low = "#ffffcc", high = "#ff4444",
space = "Lab", na.value = "grey50",
guide = "colourbar")
ggp <- ggp + labs(title="Temperature Levels: Comunitat Valenciana")
# render the map
print(ggp)

解释:

使用 readOGR(...) 导入 R 的 Shapefile属于 SpacialDataFrame 类型并有两个主要部分:一个多边形部分,其中包含每个多边形上所有点的坐标,以及一个包含每个多边形信息的数据部分(因此,每个多边形一行)。这些可以被引用,例如,使用 muni@polygonsmuni@data .效用函数 fortify(...)将多边形部分转换为使用 ggplot 组织的用于绘图的数据框.所以基本的工作流程是:
[1] Import temperature data file (temp.data)
[2] Import polygon shapefile of municipalities (muni)
[3] Convert muni polygons to a data frame for plotting (muni.df <- fortify(...))
[4] Join columns from muni@data to muni.df
[5] Join columns from temp.data to muni.df
[6] Make the plot

连接必须在公共(public)字段上完成,这是大多数问题出现的地方。原始 shapefile 中的每个多边形都有一个唯一的 ID 属性。运行 fortify(...)在 shapefile 上创建一个列, id , 基于此。但是数据部分没有 ID 列。相反,多边形 ID 存储为行名称。所以首先我们必须添加一个 id列至 muni@data如下:
muni@data$id <- rownames(muni@data)

现在我们有一个 id muni@data 中的字段和相应的 id muni.df 中的字段,所以我们可以进行连接:
muni.df <- join(muni.df, muni@data, by="id")

要创建 map ,我们需要根据温度水平设置填充颜色。为此,我们需要加入 LEVEL来自 temp.data 的列至 muni.df .在 temp.data有一个字段 CODINE它标识了自治市。现在还有一个对应的字段 CODIGOINEmuni.df .但是有一个问题: CODIGOINEchar(5) , 前导零,而 CODINE是整数,这意味着缺少前导零(可能是从 Excel 导入的?)。因此,仅加入这两个字段不会产生匹配项。我们必须先转换 CODINE进入 char(5)带前导零:
temp.data$CODINE <- str_pad(temp.data$CODINE, width = 5, side = 'left', pad = '0')

现在我们可以加入 temp.datmuni.df基于相应的字段。
muni.df <- merge(muni.df, temp.data, by.x="CODIGOINE", by.y="CODINE", all.x=T, a..ly=F)

我们使用 merge(...)而不是 join(...)因为连接字段有不同的名称和 join(...)要求它们具有相同的名称。 (但请注意, join(...) 更快,应尽可能使用)。所以,最后,我们有一个数据框,其中包含绘制多边形和温度的所有信息 LEVEL可用于为每个多边形建立填充颜色。

关于 OP 原始代码的一些注释:
  • OP 的第一张 map (顶部的绿色 map )标识了“我们地区的 30 个不同区域......”。我找不到识别这些区域的 shapefile。市政府文件确定了 543 个市镇,我看不出有办法将它们分成 30 个区域。此外,温度级别文件有 542 行,每个市(或多或少)一个。
  • OP 正在为市政当局导入线形文件以绘制边界。你不需要那个因为geom_polygon(...)将绘制(并填充)多边形和geom_path(...)将绘制边界。
  • 关于R ggplot2 与 shapefile 和 csv 数据合并以填充多边形,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19791210/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com