gpt4 book ai didi

excel - 用于确定位置之间距离的方法/工具

转载 作者:行者123 更新时间:2023-12-04 21:47:41 32 4
gpt4 key购买 nike

我在一家医疗保健公司工作,拥有有关患者位置(地址、城市、州、 zip )的信息。我试图确定有多少百分比的患者住在离 5 个特定位置最近的地方。我正在寻找的答案是“25% 的患者住在离#1 地点最近的地方,10% 的病人离 #2 地点最近,等等。”我希望有人能指出我正确的方向(应用程序使用/方法采取)。

数据存储在 Tableau 数据提取中,但使用 Excel 中的数据。

为了方便起见,我可以使用的应用程序是:
- 画面
- Excel
- Alteryx
- Python
-R

最佳答案

有多个任务可以解决这个问题。您可能希望在不同阶段将职责分配给不同的工具,例如使用 Python 或 R 预先进行一些数据准备和丰富工作,然后 Tableau 在此过程中进一步进行一些交互式可视化。

除了您提到的工具之外,我建议您花一些时间熟悉空间数据库,例如开源 PostGIS。 Oracle 和 Microsoft 也对其数据库进行了空间扩展。使用空间数据库,您可以将点、多边形和路径等空间数据与关系数据一起存储,并且它们还具有内置的空间功能。

要考虑的主要任务:

  • 地理编码 - 将地址转换为空间坐标。您将要为此使用地理编码 Web 服务,可能从 Python 或 R 调用它。这是您在准备新数据进行分析时想要做的事情,然后存储结果以供以后重用阶段。
  • 计算 voronoi 多边形。该算法用多边形平铺平面,使多边形内的所有点都最接近特定点。因此,如果您想知道哪些区域离 5 家医院最近,Voronoi 图会将 map 划分为不重叠的区域,每个医院的一个多边形包含比其他任何医院更接近该医院的区域。因此,如果您的医院不移动,您应该计算一次 voronoi 多边形并存储结果以供重复使用。 Python 和 R 中有一些库可以做到这一点。 PostGIS 还具有计算 voronoi 多边形的功能。
  • HitTest 。此步骤测试一个点是否落在多边形内。您可以通过调用专用的 R 或 Python 函数来执行 HitTest ,但我建议使用像 PostGIS 这样的空间数据库。然后,您可以通过调用函数或使用 INTERSECTS 空间连接运算符来执行 HitTest 。在将多边形加载到数据库后,您可以通过为多边形构建空间索引来优化性能。
  • 介绍,总结。这就是 Tableau 有帮助的地方。如果您正在使用空间数据库,您可以直接从空间数据库中显示点和多边形等空间数据,还可以轻松计算汇总统计数据,例如您提到的百分比。

  • 较新版本的 Tableau 对空间数据的支持甚至更多,并且可以计算距离和缓冲区,尽管将这项工作推送到空间数据库中可能仍然更快。

    这一点对很多人来说可能很明显,但要清楚一点……当您测量的点(例如医院)具有静态位置时,上述方法表现良好,因此值得花时间预先计算 Voronoi 多边形并创建任何空间索引 - 当您有许多要测试的点时也是如此。在这些情况下,预先计算的多边形和空间索引可以带来性能提升。

    对于较小的数据集,您当然可以只计算每个可能的源和每个可能的目的地之间的距离,然后选择距离最小的连接。随着数据点数量的增加,这种简单但蛮力的方法变得越来越不可行,在这种情况下,更值得努力完成上述步骤。

    关于excel - 用于确定位置之间距离的方法/工具,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61257830/

    32 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com