gpt4 book ai didi

python - Python中地理点的聚类

转载 作者:行者123 更新时间:2023-11-30 09:10:22 28 4
gpt4 key购买 nike

我有一组 400k 个地理点(带有纬度和经度),我正在尝试将其聚类并绘制在 map 上。目前我正在使用 Folium 包的 MarkerCluster 来可视化点的聚类。但这似乎非常慢并且代码无限期地运行。

只是想知道是否有其他 Python 包可以有效地用于此目的?

当前代码:

import folium
from folium import plugins
from IPython.display import Image, clear_output, display, HTML

data = df[['StartLat','StartLong']].as_matrix()
avgLat = df['StartLat'].mean()
avgLong = df['StartLong'].mean()

mapa = folium.Map([avgLat, avgLong], zoom_start=6)
marker_cluster = folium.MarkerCluster().add_to(mapa)
latArr = np.array(df.StartLat)
lonArr = np.array(df.StartLong)

for i in range(len(latArr)):
folium.Marker([latArr[i], lonArr[i]], icon = folium.Icon(color='green',icon='ok-sign')).add_to(marker_cluster)
mapa.save('Clustering.html')

最佳答案

让我尝试分两步回答您的问题:

  1. 你见过question here吗? ?他们也有同样的问题,即对大量地理坐标进行聚类。建议的解决方案使用 scipy.cluster

  2. 中的聚类算法
  3. 但是,对于地理纬度而言。普通的聚类分析技术可能不太适合。这主要是因为从地球表面采集的点样本往往彼此相关 ( spatial autocorrelation )。因此,这些点违反了经典统计中许多技术所固有的独立性条款。因此,如果您坚持使用 Python,我建议您查看 clusterPy 包 ( link here )。他们有几种常用于空间数据的聚类算法的实现。对空间自相关性的一些阅读也可能有助于理解某些算法通常需要作为参数的考虑因素(例如距离带)。

关于python - Python中地理点的聚类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40745437/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com