作者热门文章
- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
所以我希望将聚类算法应用于 usgs 提供的地球数据。
http://earthquake.usgs.gov/earthquakes/feed/
我的主要目标是根据地震反馈确定前 10 个最危险的地方(根据地震次数或某个地方经历的地震强度)。
有没有关于如何做的建议?我正在查看 k-means,然后只计算 k-means 的总和(每个地震震级在每个集群中加权)来查看最危险的集群。
我也在用 ruby 编写它作为代码引用。
谢谢
最佳答案
K-means 不能很好地处理数据集中的异常值。
此外,它是围绕方差设计的,但纬度和经度的方差并没有真正意义。事实上,k-means 无法处理纬度 +-180° 环绕。相反,您需要使用大圆距离。
因此,请尝试使用基于密度 的聚类算法,该算法允许您使用诸如大圆距离之类的距离!
阅读维基百科和一本关于聚类分析的好书。
关于algorithm - 聚类算法——应用于一组地震数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15083842/
我是一名优秀的程序员,十分优秀!