- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我正在遵循“Lucene in Action”中的示例,第 308-315 页,它描述了 Lucene Spatial。我正在使用 lucene 2.9.4。我用过 http://geocoder.us/service/distance endpoint 来计算一些位置之间的距离,然后编写单元测试来验证索引可以找到给定半径内的位置。
我想知道我能期望 lucene 有多准确。例如,如果我给半径 10.0,我的纬度/经度点之间的距离是 9.99 英里,它是否能够在所有情况下找到这个位置?
提出这个问题的是,我发现搜索对于小半径值(例如 10.0 或更小)非常准确,而对于较大的值(例如 r=25.0)则不准确。
有什么我可能做错的吗?搜索者是否有可能选择一个没有给定半径的所有纬度/经度的层?我的理解是它选择了保证所有点都在半径内的最小层,即层算法只是一种优化。
编辑:我还发现了这个:https://issues.apache.org/jira/browse/LUCENE-2519和这里明显固定的代码:http://code.google.com/p/spatial-search-lucene/source/browse/trunk/src/main/java/org/apache/lucene/spatial/tier/projection/SinusoidalProjector.java?r=38 ,但是当我修补我的代码以使用固定的 SinusoidalProjector 时,我的索引在所有情况下都返回零广告。
这并没有给我很大的信心:
http://www.lucidimagination.com/blog/2010/07/20/update-spatial-search-in-apache-lucene-and-solr/
这似乎表明整个代码中都存在黑客攻击,仅修补 SinusoidalProjector 是不够的。
最佳答案
我花了一些时间查看源代码,我想我明白出了什么问题。首先,我做了一个错误的假设,即由 geocoder.us 计算的距离与 lucene 内部计算的点间距离相同。这些值很接近,但不精确。所以我转而通过调用 lucene 来计算纬度/经度对之间的距离
double distance = DistanceUtils.getInstance().getDistanceMi(lat1,lon1,lat2,lon2);
接下来我深入研究了 DistanceQueryBuilder 类 http://grepcode.com/file/repo1.maven.org/maven2/org.apache.lucene/lucene-spatial/2.9.4/org/apache/lucene/spatial/tier/DistanceQueryBuilder.java?av=f ,我认为它有一个错误。
它计算边界框是为了像这样获取笛卡尔层:
CartesianPolyFilterBuilder cpf = new CartesianPolyFilterBuilder(tierFieldPrefix);
Filter cartesianFilter = cpf.getBoundingArea(lat, lng, miles);
通过查看 LLRect.createBox http://grepcode.com/file/repo1.maven.org/maven2/org.apache.lucene/lucene-spatial/2.9.4/org/apache/lucene/spatial/geometry/shape/LLRect.java#LLRect.createBox%28org.apache.lucene.spatial.geometry.LatLng%2Cdouble%2Cdouble%29 就很清楚了getBoudningArea 的第三个参数将被视为边界框的完整宽度/高度。因此传递半径值会导致边界框太小。
解决方法是提供一个替代版本的 DistanceQueryBuilder 来执行此操作:
Filter cartesianFilter = cpf.getBoundingArea(lat,lng,miles*2);
这似乎有效。我仍然相信 DistanceApproximation http://grepcode.com/file/repo1.maven.org/maven2/org.apache.lucene/lucene-spatial/2.9.4/org/apache/lucene/spatial/geometry/shape/DistanceApproximation.java#DistanceApproximation.getMilesPerLngDeg%28double%29虽然被打破了,因为看起来以下操作应该是可逆的,但它们不是:
// similar to implementation of DistanceUtils.getBoundary():
double milesPerLng = DistanceApproximation.getMilesPerLngDeg(lat);
double milesPerLat = DistanceApproximation.getMilesperLatDeg();
double lngDelta = radius / milesPerLng;
double latDelta = radius / milesPerLat;
// Now it seems like this should be roughly true:
assertEquals(radius, DistanceUtils.getInstance().getDistanceMi(lat,lng,lat,lng+lngDelta));
assertEquals(radius, DistanceUtils.getInstance().getDistanceMi(lat,lng,lat+latDelta,lng));
但事实并非如此。例如,当上面的代码给出 lat=34、lng=-118 和 radius=25 时(而不是断言我只是打印结果),我得到:
Lng delta: 0.36142327178505024, dist: 20.725929003138496
Lat delta: 0.4359569489852007, dist: 30.155567734407825
我猜测代码之所以有效,只是因为在选择边界框后选择的笛卡尔层会导致区域比边界框大一些。但我不认为这会得到保证。
我希望对此有更多了解的人可以发表评论,因为这些只是在挖掘代码一个下午后的观察结果。我确实注意到 lucene spatial 的最新代码在 googlecode 上看起来像:http://code.google.com/p/spatial-search-lucene/ , 似乎实现发生了重大变化,但我没有深入挖掘细节。
关于java - Lucene 空间、准确性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6667672/
运行 Tomcat 失败并出现 java.lang.OutOfMemoryError - 与缺少 PermGen 空间相关的错误。 我最近将 Tomcat 更改为以自己的用户(而非 root)运行。
我们有一个表,其中包含数百万行,其中包含 PostGIS 几何图形。我们要执行的查询是:落在边界几何内的最新条目是什么?这个查询的问题是我们经常会有大量的项目匹配边界框(半径大约为 5 公里),然后
我有一个Elasticsearch设置,它将允许用户搜索通配符作为索引。 array:3 [ "index" => "users" "type" => "user" "body" => arra
我创建了一个表,其中每行包含两个按钮,并且两个按钮连接在一起,我想将两个按钮分开。我用过 不起作用,css 也是,这是他们的另一种方式。 我有另一个问题,因为我不想在表格边框内显示操作按钮,而是在靠近
我试图在 jQuery Mobile 中的两个按钮之间留出空白。现实中的布局是这样的: Button 1 Button 2 (Hidden w/ display: none)
按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
您好,我对图表应用程序还很陌生。现在我为我的应用程序创建了条形图。当我运行 create bar chart as separate project 时,输出如下所示。 然后当我将条形图与我的应用程序
我在使用 H2 和 GeoDB(内存中,junit)时遇到问题。 另外,使用 Hibernate 5(每个包的最新版本,包括 hibernate-spatial)和 Spring 4。 通过 id 实
我想画一张澳大利亚的 map ,并将每个城市表示为一个点。 然后突出显示人口众多(> 1M)的城市 library(sp) library(maps) data(canada.cities) head
关闭。这个问题是opinion-based .它目前不接受答案。 想改进这个问题?更新问题,以便 editing this post 提供事实和引用来回答它. 6年前关闭。 Improve this
如何保持.txt文件中存在的空格?在.txt文件中,它表示: text :text text1 :text1 text23 :text2 text345 :text3 如果我写这段
以下哪个键最大? 选项 1:16 个数字 [0,9] 选项 2:30 个元音 选项 3:字母表中的 16 个字母 选项 4:32 位 有人可以帮助我,告诉我哪一个是正确的答案以及我们如何计算它吗?我知
在 Unity 3d 中使用 Azure 空间 anchor 来实现在 iOS 和 Android 上部署的室内和室外增强现实体验是否有益? 最佳答案 是的,对于 Azure Spatial Anch
我有一个绝对定位的圆形图像。图像只需占据屏幕宽度的 17%,并且距离顶部 5 个像素。 问题是,当我调整图像大小以占据屏幕宽度的 17% 时,它会这样做,但同时容器会变长。图像本身不会拉伸(stret
我在 Ubuntu 14.04 上使用 Cassandra。从文档中,我可以看到运行命令: nodetool snapshot 创建我的 key 空间的快照。 命令的输出是: nodetool sn
Heroku引入了“私有(private)空间”,是否可以将现有应用迁移到私有(private)空间? https://blog.heroku.com/archives/2015/9/10/herok
是否允许在语义记录中使用非绑定(bind)空格 或其他 HTML 编码字符?我遇到的问题是 ; 字符被软件视为记录的结尾。 例如:假设我有一份婚姻记录,其中包含 2 个结婚者的姓氏、结婚年份以及结
我正在研究“智能 parking ”项目,偶然发现了包含我们真正需要的YouTube视频。我们已经实现了第一部分,即从视频源进行实时透视变换,下一步是将其定义为一组矩形 我基本上需要知道他是如何做到的
我有两个类:Engine 和 Trainset(多个单元),这两个类共享其 ID 空间,其中包含名称和系列 id=- . 这是我的Engine类(它是抽象的,因为有引擎的子类型(DieselEngin
如果有人能帮助我,那就太好了。 我正在尝试使用Java的Split命令,使用空格分割字符串,但问题是,字符串可能没有空格,这意味着它将只是一个简单的顺序(而不是“输入2”将是“退出”) Scanner
我是一名优秀的程序员,十分优秀!