- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我有一个点列表 P=[p1,...pN],其中 pi=(latitudeI,longitudeI)。
我想使用 Python 3 找到一组最小的集群(P 的不相交子集),使得集群中的每个成员与集群中其他每个成员的距离都在 20 公里以内。
两点之间的距离是使用 Vincenty method 计算的.
为了更具体一点,假设我有一组点,例如
from numpy import *
points = array([[33. , 41. ],
[33.9693, 41.3923],
[33.6074, 41.277 ],
[34.4823, 41.919 ],
[34.3702, 41.1424],
[34.3931, 41.078 ],
[34.2377, 41.0576],
[34.2395, 41.0211],
[34.4443, 41.3499],
[34.3812, 40.9793]])
然后我尝试定义这个函数:
from geopy.distance import vincenty
def clusters(points, distance):
"""Returns smallest list of clusters [C1,C2...Cn] such that
for x,y in Ci, vincenty(x,y).km <= distance """
return [points] # Incorrect but gives the form of the output
注意:许多问题都集中在地理位置和属性上。我的问题是仅限位置。这是纬度/经度,不是欧氏距离。还有其他问题给出了某种答案但不是这个问题的答案(许多未回答):
最佳答案
这可能是一个开始。该算法尝试通过将 k 从 2 迭代到沿途验证每个解决方案的点数来对点进行 k 均值聚类。您应该选择最小的数字。
它的工作原理是对点进行聚类,然后检查每个聚类是否遵守约束。如果任何集群不合规,解决方案将被标记为 False
,然后我们继续处理下一批集群。
因为 sklearn 中使用的 K-means 算法会陷入局部极小值,证明这是否是您正在寻找的解决方案是最佳的解决方案仍有待确定,但它可以成为一个
import numpy as np
from sklearn.cluster import KMeans
from scipy.spatial.distance import cdist
import math
points = np.array([[33. , 41. ],
[33.9693, 41.3923],
[33.6074, 41.277 ],
[34.4823, 41.919 ],
[34.3702, 41.1424],
[34.3931, 41.078 ],
[34.2377, 41.0576],
[34.2395, 41.0211],
[34.4443, 41.3499],
[34.3812, 40.9793]])
def distance(origin, destination): #found here https://gist.github.com/rochacbruno/2883505
lat1, lon1 = origin[0],origin[1]
lat2, lon2 = destination[0],destination[1]
radius = 6371 # km
dlat = math.radians(lat2-lat1)
dlon = math.radians(lon2-lon1)
a = math.sin(dlat/2) * math.sin(dlat/2) + math.cos(math.radians(lat1)) \
* math.cos(math.radians(lat2)) * math.sin(dlon/2) * math.sin(dlon/2)
c = 2 * math.atan2(math.sqrt(a), math.sqrt(1-a))
d = radius * c
return d
def create_clusters(number_of_clusters,points):
kmeans = KMeans(n_clusters=number_of_clusters, random_state=0).fit(points)
l_array = np.array([[label] for label in kmeans.labels_])
clusters = np.append(points,l_array,axis=1)
return clusters
def validate_solution(max_dist,clusters):
_, __, n_clust = clusters.max(axis=0)
n_clust = int(n_clust)
for i in range(n_clust):
two_d_cluster=clusters[clusters[:,2] == i][:,np.array([True, True, False])]
if not validate_cluster(max_dist,two_d_cluster):
return False
else:
continue
return True
def validate_cluster(max_dist,cluster):
distances = cdist(cluster,cluster, lambda ori,des: int(round(distance(ori,des))))
print(distances)
print(30*'-')
for item in distances.flatten():
if item > max_dist:
return False
return True
if __name__ == '__main__':
for i in range(2,len(points)):
print(i)
print(validate_solution(20,create_clusters(i,points)))
一旦建立了基准,就必须在每个集群中多关注一个,以确定其点是否可以在不违反距离限制的情况下分配给其他人。
你可以用你选择的任何距离度量替换 cdist 中的 lambda 函数,我在我提到的 repo 中找到了大圆距离。
关于python - 如何按距离对地理点列表进行聚类?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53075481/
我想知道地理数据、几何数据和数据库系统(例如 Oracle 或 SqlSqerver)中表示空间数据的标准数据类型之间有什么区别? 对我来说看起来是一样的,但我知道肯定有区别。. 最佳答案 首先,地理
我正在寻找用于存储 map 的理想数据库或数据结构的建议。本质上, map 由“道路”组成,如道路、路径等。道路包含节点(具有纬度和经度坐标,有时还有高度。) 任何此类数据库或结构: 应该能够快速(毫
我最近将一些预装的国家和省份形状下载到 Sql Server 2008 中 http://sqlsamplegeo.codeplex.com/ 除了地理列,每个国家和省都有一个“ShapeArea”和
我对google Analytics(分析)地理如何工作(特别是对于出差用户)有疑问。例如,如果我是森尼韦尔市的用户,并且我打开了一个应用程序,则Google ID在用户ID级别的分析将说用户数= 1
我正在使用 Geo::IP 对 IP 地址执行位置查找。一切正常,直到我遇到一个不在地理 IP 查找数据库中的 IP 地址并且程序突然关闭并给出此错误 Can't call method "city"
通用(或设备无关)物理位置的结构是什么?我的猜测是它可能是一个有两个长字段的结构,或者类似的东西。 此外,给定一个目的地位置和两个候选位置,是否有一种简单的算法可以确定哪个候选位置最接近目的地?我并不
我正在使用 d3 geomaps 创建美国的地理 map 。当我将鼠标悬停在状态上时,我希望突出显示该状态。那可能吗?这是我当前的代码:
在geoviews guide for Bokeh ,它指出 Bokeh 仅支持墨卡托投影,但大多数示例投影使用 PlateCarree,然后输出看起来像墨卡托投影。 有人知道图形的投影和输出是怎么回
我有一个geodataframe'all_locations',其中有一个几何列和一个带有点名称的列。在 map 上绘制点工作正常,但我想用位置名称注释这些点。 ['位置'] ['几何'] BUITH
我正在尝试在 Canvas 中缩放 map 。 var projection = d3.geoMercator() projection.fitExtent([[margin.left, margin
我目前正在处理这段代码,一切正常,但是当我用鼠标悬停在一个国家/地区时,我只希望国家/地区名称出现在标签中,而不是相关值。我可以这样做吗?如果是,怎么办? 提前致谢! 这是javascript代码:
我正在尝试在 mac os 上使用 Geodjango,我使用 postgresql 并安装了 GEOS,但出现此错误: dlopen(/usr/local/lib/libgeos_c.dylib,
我正在研究 GeoViews,我想知道我们是否可以将 slider 作为 GeoViews 中等值线图的输入。 我在 gdf 中有另一个变量,它是年份。是否可以使用 slider 显示年度 Tot
我有一个 Geometry (看起来像 WKB) 我的 postgres/postgis 数据库中的对象,我已经转储到 BigQuery 来做一些有趣的事情。我看到它存储为 bytes .我如何构建一
我正在使用 DPM 进行 azure 在线备份,并且想要将冗余从 Geo 更改为 Local,但它显示为灰色。有办法改变吗? 我不想为此创建新的错误,然后我必须再次将所有内容从 DPM 重新上传到 A
我正在实现 Google 地理 map ,我想做的是,例如,如果我单击 US在 map 上,我会将国家/地区名称作为警报(例如,如果我单击美国,我必须将美国作为警报),我最终可以将其用作变量。当我尝试
我正在制作一张具有缩放和平移功能的世界地图。我在某些城市上画了圆圈,圆圈的半径由数据决定。当鼠标悬停在这些圆圈上时,将出现一个工具提示来显示数据。 代码结构为 //在此选择上调用缩放行为 - 让我们调
我需要一个函数来计算一对 WGS 84 之间的距离定位到高精度,我计划使用 boost geometry 中的 geographic 函数. boost geometry Design Rationa
我正在尝试缓冲数据集中半径为 100 公里的点。我正在使用函数 gBuffer来自包裹rgeos .这是我到目前为止所拥有的: head( sampledf ) # postalcode
我正在用 C# 开发一个应用程序,它将使用 SQL Server 2008 中的“地理”数据类型来使用和存储地理位置。我计划使用 Entity Framework ,但很快发现它不支持空间数据。有没有
我是一名优秀的程序员,十分优秀!