python - DBSCAN 用于地理位置数据的聚类-6ren

python - DBSCAN 用于地理位置数据的聚类

转载作者：IT老高更新时间：2023-10-28 20:50:10

47

4

我有一个包含纬度和经度对的数据框。

这是我的数据框的样子。

    order_lat  order_long
0   19.111841   72.910729
1   19.111342   72.908387
2   19.111342   72.908387
3   19.137815   72.914085
4   19.119677   72.905081
5   19.119677   72.905081
6   19.119677   72.905081
7   19.120217   72.907121
8   19.120217   72.907121
9   19.119677   72.905081
10  19.119677   72.905081
11  19.119677   72.905081
12  19.111860   72.911346
13  19.111860   72.911346
14  19.119677   72.905081
15  19.119677   72.905081
16  19.119677   72.905081
17  19.137815   72.914085
18  19.115380   72.909144
19  19.115380   72.909144
20  19.116168   72.909573
21  19.119677   72.905081
22  19.137815   72.914085
23  19.137815   72.914085
24  19.112955   72.910102
25  19.112955   72.910102
26  19.112955   72.910102
27  19.119677   72.905081
28  19.119677   72.905081
29  19.115380   72.909144
30  19.119677   72.905081
31  19.119677   72.905081
32  19.119677   72.905081
33  19.119677   72.905081
34  19.119677   72.905081
35  19.111860   72.911346
36  19.111841   72.910729
37  19.131674   72.918510
38  19.119677   72.905081
39  19.111860   72.911346
40  19.111860   72.911346
41  19.111841   72.910729
42  19.111841   72.910729
43  19.111841   72.910729
44  19.115380   72.909144
45  19.116625   72.909185
46  19.115671   72.908985
47  19.119677   72.905081
48  19.119677   72.905081
49  19.119677   72.905081
50  19.116183   72.909646
51  19.113827   72.893833
52  19.119677   72.905081
53  19.114100   72.894985
54  19.107491   72.901760
55  19.119677   72.905081

我想聚集这些彼此最近的点(200米距离)，下面是我的距离矩阵。

from scipy.spatial.distance import pdist, squareform
distance_matrix = squareform(pdist(X, (lambda u,v: haversine(u,v))))

array([[ 0.        ,  0.2522482 ,  0.2522482 , ...,  1.67313071,
     1.05925366,  1.05420922],
   [ 0.2522482 ,  0.        ,  0.        , ...,  1.44111548,
     0.81742536,  0.98978355],
   [ 0.2522482 ,  0.        ,  0.        , ...,  1.44111548,
     0.81742536,  0.98978355],
   ..., 
   [ 1.67313071,  1.44111548,  1.44111548, ...,  0.        ,
     1.02310118,  1.22871515],
   [ 1.05925366,  0.81742536,  0.81742536, ...,  1.02310118,
     0.        ,  1.39923529],
   [ 1.05420922,  0.98978355,  0.98978355, ...,  1.22871515,
     1.39923529,  0.        ]])

然后我在距离矩阵上应用 DBSCAN 聚类算法。

 from sklearn.cluster import DBSCAN

 db = DBSCAN(eps=2,min_samples=5)
 y_db = db.fit_predict(distance_matrix)

我不知道如何选择 eps 和 min_samples 值。它将太远的点聚集在一个簇中。(距离约2公里)是因为它在聚类时计算欧几里得距离吗？请帮忙。

最佳答案

您可以使用 scikit-learn 的 DBSCAN 对空间经纬度数据进行聚类，而无需预先计算距离矩阵。

db = DBSCAN(eps=2/6371., min_samples=5, algorithm='ball_tree', metric='haversine').fit(np.radians(coordinates))

这来自 clustering spatial data with scikit-learn DBSCAN 上的本教程。特别是，请注意 eps 值仍然是 2km，但它除以 6371 以将其转换为弧度。另外，请注意 .fit() 采用弧度单位的坐标作为半正弦度量。

关于python - DBSCAN 用于地理位置数据的聚类，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34579213/

47

4

0

文章推荐： java - Java 接口(interface)中的可选方法

文章推荐： java - SwingUtilities.invokeLater 做什么？

文章推荐： java - 相似度得分 - Levenshtein

文章推荐： java - JUnit:@Before 仅用于某些测试方法？

地理位置，是否可以从地址获取纬度和经度并本地存储在我的数据库中
我希望能够在本地运行查询，比较位置的纬度和经度，这样我就可以根据距离对我捕获的某些地址运行查询。我找到了一个免费数据库，其中包含有关邮政编码的信息，但我想要此信息以获取更具体的地址。我查看了谷歌的地
javascript - 地理位置 - 将纬度和经度值分配给变量
这个问题已经有答案了: Why is my variable unaltered after I modify it inside of a function? - Asynchronous code
javascript - 当用户导航到特定部分时执行功能(地理位置)
我正在为我正在构建的网站使用此免费模板:http://blackrockdigital.github.io/startbootstrap-scrolling-nav/ 我正在使用地理定位服务 (Goo
javascript - 地理位置:按接近度过滤
我有一个 JSON 格式的来自世界各地的用户列表。列表中的每个项目都有一个位置信息。如何将这些位置转换为正确的经度和纬度？如何过滤这些位置以仅获取距我当前位置 50 英里范围内的位置(假设我知道如
iOS 地理位置(总是返回该位置在英国伦敦)
我多年来一直在寻找一种解决方案，让我可以通过 Wi-Fi 显示我的设备位置，但实际上并未连接到任何网络。所以它只是打开了 Wi-Fi，但是我尝试过的每一种方法都会返回我位于伦敦的信息。有谁知道为什么会
javascript - 将箭头指向位置(地理位置)
我想在移动网站上制作一种指南针。这就是我所拥有的: 这就是我想要的: 我将当前位置保存在本地存储中。然后，例如再前进 1 公里，我检查我的位置并检查两点之间的距离。现在我想要一个从当前位置到本地存储
c# - 地理位置 - 它是如何工作的？
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开，visit the help center . 关闭 1
c# - 地理位置、服务和本地通知
我正在尝试制作我的第一个与地理定位和本地通知相关的 Android 系统应用程序。我想象它是这样的......有基本的 Activity MainActivity。启动后，它会启动一个服务 TestS
php - 按经纬度查找子公司(地理位置)
我正在寻找一个快速 MySQL 查询，它可以从一个简单的表中返回最近的位置: 表:位置: id | city | latitude | longitude -----------
security - Windows Azure 地理位置
我正在为一家欧洲公司研究 Windows Azure 的功能。他们的担忧之一是数据将由美国的服务器处理/存储。 (关于爱国行为) 微软确实提供了选择地理位置的选项，但我还没有发现他们保证数据不会在美国
javascript - 获取从当前位置(地理位置)到预定义目的地的路线
Nog 我有以下页面，其中包含前往预定义目的地的路线: example directions 这与以下代码完美配合: My Google Maps Demo
java - Android 地理位置(当应用程序未运行时)
我正在寻找有关全天在 Android 上检查位置(大约每 15 分钟)并存储地理坐标的信息。当应用程序在后台时也会发生这种情况，而不仅仅是当应用程序在前台运行时。我不确定搜索词，我似乎找不到任何东西。
javascript - 标题 javascript 地理位置
我想创建一个网站，其功能应该是阅读您当前的标题。最佳答案我假设您已经知道如何 use the JavaScript geolocation API以及如何在 JavaScript 中呈现旋转箭头，
javascript - 地理位置/Javascript 范围问题
我有一个关于地理定位和 javascript 变量范围的问题。我一直在玩弄它，但我是一个 php 人，js 不是我最好的语言。我正在制作谷歌地图，我想将用户坐标设置为 map 中心并设置缩放比例。如果
php - 地理位置 - PHP 数组排序
我在一个目录中有一堆营业地点的记录。实际上大约有 4,500 个。目前我的速度有点问题，有两个原因。当用户加载页面时，系统会要求他们输入邮政编码。当他们这样做时，页面将重新加载并获取所有企业，fo
javascript - 地理位置 watchPosition 每秒触发一次
在我的 Ionic 应用程序中，我使用以下选项实现了地理位置 watchPosition。我的选项设置为每 10 秒触发一次，但它每秒触发一次。通常每秒会触发两次。 function watchPos
javascript - 在数组中存储坐标(地理位置)以计算距离
我和我的搭档正在为我们的学校论文开发一个练习 Web 应用程序。我们正在尝试使用地理定位 api 的 watchposition() 函数获取运行者的位置并在他锻炼期间跟踪他。在屏幕上，运行者可以检查
android - 地理位置 : intent with a placeid
我正在尝试制作一个按钮以在设备上启动谷歌地图并打开到特定位置[不只是纬度/经度，尽管这是后备]。我有一个地点 ID，并想启动一个 geo: 到该地点的 Intent 。我似乎找不到我需要的 uri
javascript - 地理位置 API - 不同的结果
我正在通过 WIFI 和 cable 连接使用 LAN。两者在相同的 IP 下对外部可见。但不知何故，当我尝试获取地理定位时 (HTML5 Geolocation API 上的经度和纬度)，它会显示
sql - 地理位置 SQL 查询找不到确切位置
我测试我的地理定位查询已经有一段时间了，直到现在我还没有发现任何问题。我试图搜索给定半径内的所有城市，通常我使用城市的坐标搜索城市周围的城市，但最近我尝试在城市周围搜索并发现城市本身没有返回。我的

首页

博学

6Ren·AI

商城

python - DBSCAN 用于地理位置数据的聚类