gpt4 book ai didi

python - 通过给定的 geojson 分割包含 lat/lng 的 pandas DataFrame

转载 作者:行者123 更新时间:2023-12-01 08:40:09 24 4
gpt4 key购买 nike

我有一个包含 latlng 列的 DataFrame。我还有包含多边形的 FeatureCollection geojson。给定这个多边形,我如何分割我的 df 并以​​有效的方式仅选择给定多边形内的行?我想避免循环 df 并手动检查每个元素。

d = {'lat' : [0,0.1,-0.1,0.4],
'lng' : [50,50.1,49.6,49.5]}


df = pd.DataFrame(d)

这是显示 1 个多边形和 4 个点的要素集合。正如您所看到的,只有最后一个点在外面。

{
"type": "FeatureCollection",
"features": [
{
"type": "Feature",
"properties": {},
"geometry": {
"type": "Polygon",
"coordinates": [
[
[
0,
49
],
[
0.6,
50
],
[
0.1,
52
],
[
-1,
51
],
[
0,
49
]
]
]
}
},
{
"type": "Feature",
"properties": {},
"geometry": {
"type": "Point",
"coordinates": [
0,
50
]
}
},
{
"type": "Feature",
"properties": {},
"geometry": {
"type": "Point",
"coordinates": [
0.1,
50.1
]
}
},
{
"type": "Feature",
"properties": {},
"geometry": {
"type": "Point",
"coordinates": [
-0.1,
49.6
]
}
},
{
"type": "Feature",
"properties": {},
"geometry": {
"type": "Point",
"coordinates": [
0.4,
49.5
]
}
}
]
}

this map显示多边形和点。

编辑:以下是我目前的代码,但正如您所料,它非常慢。

from shapely.geometry import shape, Point
# check each polygon to see if it contains the point
for feature in feature_collection['features']:
polygon = shape(feature['geometry'])
for index, row in dfr.iterrows():
point = Point(row.location_lng, row.location_lat)
if polygon.contains(point):
print('Found containing polygon:', feature)

其中dfr是我的DataFrame,其中包含location_latlocation_lngfeature_collection 是一个只有多边形的 geojson 特征集合(请注意,上面的 geojson 示例只是为了解释问题,它只有 1 个多边形,并且有一些点来说明问题)。

最佳答案

假设您有数据框dfr,例如:

   location_lat  location_lng
0 0.0 50.0
1 0.1 50.1
2 -0.1 49.6
3 0.4 49.5

以及包含多边形的feature_collection,例如:

{
"type": "FeatureCollection",
"features": [
{
"type": "Feature",
"properties": {},
"geometry": {
"type": "Polygon",
"coordinates": [[[0,49],[0.6,50],[0.1,52],[-1,51],[0,49]]]
}
},
{
"type": "Feature",
"properties": {},
"geometry": {
"type": "Polygon",
"coordinates": [[[0,50],[0.6,50],[0.1,52],[-1,51],[0,50]]]
}
}]
}

我将第二个多边形中的 49 更改为 50,以删除其中的其他点。

您可以首先使用dfr中的点创建一个列:

#using Point from shapely and apply
from shapely.geometry import Point
dfr['point'] = dfr[['location_lat', 'location_lng']].apply(Point,axis=1)

#or use MultiPoint faster
from shapely.geometry import MultiPoint
dfr['point'] = list(MultiPoint(dfr[['location_lat', 'location_lng']].values))

第二种方法在小数据帧上似乎更快,所以我什至会在更大的数据帧上使用这个方法。

现在,您可以为 feature_collection 中的每个多边形创建一个列,其中包含该点是否属于该要素,我想通过循环它们:

from shapely.geometry import shape
for i, feature in enumerate(feature_collection['features']):
dfr['feature_{}'.format(i)] = list(map(shape(feature['geometry']).contains,dfr['point']))

然后 dfr 看起来像:

   location_lat  location_lng              point  feature_0  feature_1
0 0.0 50.0 POINT (0 50) True False
1 0.1 50.1 POINT (0.1 50.1) True True
2 -0.1 49.6 POINT (-0.1 49.6) True False
3 0.4 49.5 POINT (0.4 49.5) False False

要选择哪个点属于某个要素,请执行以下操作:

print (dfr.loc[dfr['feature_1'],['location_lat', 'location_lng']])
location_lat location_lng
1 0.1 50.1

关于python - 通过给定的 geojson 分割包含 lat/lng 的 pandas DataFrame,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53544034/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com