- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我试图让特定的搜索工作,但事实证明这是有问题的。实际的源数据相当复杂,但可以通过以下示例进行总结:
I have articles that are indexed so that they can be searched. Each article also has multiple properties associated with it which are also indexed and searchable. When users search, they can get hits in either the main article or the associated properties. Regardless of where a hit is achieved, the article is returned as a search hit (ie. the properties are never a hit in their own right).
Each property has security on it, which means that for any given user, they may or may not be able to see the property. If a user cannot see a property, they obviously do not get a search hit in it. This security check is proprietary and cannot be done using the typical mechanism of storing a role in the index alongside the other fields in the document.
+---------+------------+------------+
| Article | Property 1 | Property 2 |
+---------+------------+------------+
| A | X | J |
| B | Y | K |
| C | Z | L |
+---------+------------+------------+
最佳答案
现在已经实现了这个(经过大量的挠头和逐步完成 Lucene 搜索),我想我会回帖我是如何实现它的。
因为我对所有结果都感兴趣(即一次不是一个页面),所以我可以避免使用 Hits
对象(无论如何在更高版本的 Lucene 中已被弃用)。这意味着我可以使用 Search(Weight, Filter, HitCollector)
来做我自己的热门收藏。 IndexSearcher
的方法,迭代所有可能的结果并适当组合文档命中。为此,我必须使用 Lucene 的查询机制,但仅当存在 AND 和 NOT 子句时。这是通过以下方式实现的:
QueryParser
和覆盖 GetBooleanQuery(ArrayList, bool)
返回我自己的实现。 BooleanQuery
(从自定义 QueryParser
返回)和覆盖 CreateWeight(Searcher)
返回我自己的实现。 Weight
(从自定义 BooleanQuery
返回)和覆盖 Scorer(IndexReader)
返回我自己的实现。 BooleanScorer2
(从自定义 Weight
返回)并覆盖 Score(HitCollector)
方法。这就是处理自定义逻辑的内容。 Score(HitCollector)
的执行自定义中的方法
BooleanScorer2
类现在负责执行自定义逻辑。如果没有需要的子评分者,评分可以传递给基础
Score
方法并正常运行。如果需要子评分器,则表示查询中存在 NOT 或 AND 子句。在这种情况下,问题中提到的特殊组合逻辑就起作用了。我有一个类(class)叫
ConjunctionScorer
这样做(这与 Lucene 中的
ConjunctionScorer
无关)。
ConjunctionScorer
获取评分者列表并对其进行迭代。对于每一个,我提取命中及其分数(使用
Doc()
和
Score()
方法)并创建我自己的搜索命中集合,其中仅包含当前用户在执行相关安全检查后可以看到的那些命中。如果另一个得分手已经找到了命中,我将它们组合在一起(使用他们的得分平均值作为他们的新得分)。如果命中来自被禁止的得分手,如果已经找到命中,我将删除该命中。
HitCollector
传入
BooleanScorer2.Score(HitCollector)
方法。这是一个定制
HitCollector
我传入了
IndexSearcher.Search(Query, HitCollector)
最初执行搜索的方法。当此方法返回时,我的自定义
HitCollector
现在包含我想要的组合在一起的搜索结果。
ConjunctionScorer
中将命中组合在一起完成的。 .请注意,这是针对 Lucene v2.3.2 的,在以后的版本中可能会有所不同。
关于lucene - 在 Lucene 中将来自多个文档的命中合并为一个命中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1393551/
关于 APC 操作码缓存,什么是“命中与未命中”?我已经安装了 APC 并且它运行良好,但我有“一些”失误,我想知道这是否“不好”。此外,我正在运行 Openx,因此,我很快就会填满“缓存完整计数”。
我试过这个: def test_send_confirm_hit(monkeypatch): hit = False def called(): global hit
是否可以将找到的单词插入到替换中? $(function() { content = 'hallo mein name ist peter und ich komme aus berlin.
我有一个允许用户将文件上传到文件夹的网站。首先,我检查文件是否存在,如果存在,然后检查复选框的值以确定用户是否要覆盖现有文件。如果点击上传并且未选中该框,我会执行一个带有消息和后退按钮的 die()
我有多个不同的进程通过 IPC 进行通信,当使用 gdb 调试单个进程时,每当遇到断点时,我都会尝试向其他进程发送消息。有没有一种方法可以自动在遇到断点时自动调用一个函数/一段代码(NotifyAll
目前,通过管道传输到 jq 的 cat 命令帮助我解析工作目录中的多个 JSON 文件,并根据正则表达式模式匹配文件中所有可用的电子邮件 ID。但是,我很想识别正则表达式模式被命中/匹配的文件名 ca
我们希望将 podname 解析为 IP,以在 akka 集群中配置种子节点。这是通过在 Kubernetes 中使用 headless (headless)服务和有状态集的概念来实现的。但是,如何在
Maven 项目具有以下文件夹结构: src/main/java src/main/resources src/test/java src/test/resources 如果我们导航到 Maven 项
我只使用 c 几个星期,所以很可能会出现我忽略的明显错误。我看过其他线程,但我不明白我正在读的很多内容。该程序假设有一个无限大的牌组。 已知问题: clearBuffer 当前未使用,我正在尝试不同的
我已将我的 AdMob 代码实现到我的 XML 文件中,如下所示: 在我的 Activity 的 onCreate 方法中: // load ads
我的作业是通过示例程序确定给定跟踪文件的缓存读/写/未命中/命中次数。 举例来说,这是示例跟踪输出的前 10 行。 0x37c852: W 0xbfd4b18c 0x37cfe0: W 0xbfd
https://plnkr.co/edit/2h6fV5yTjeUqLP3SvbvO?p=preview 预期 登录后应用程序重定向到 $state container,其中包含 dashboard
ElasticSearch 独立于 from 和 size 参数,基于查询的所有命中构建聚合结果。在大多数情况下,这是我们想要的,但我有一个特殊情况,我需要将聚合限制为前 N 个命中。 limits
我使用 Intel PCM 进行细粒度的 CPU 测量。在我的代码中,我试图测量缓存效率。 基本上,我首先将一个小数组放入 L1 缓存(通过多次遍历),然后启动计时器,再遍历数组一次(希望使用缓存),
我在为 javascript 滑动元素定义点击区域时遇到问题。 参见示例: http://www.warface.co.uk/clients/warface.co.uk/ 请滑过右侧的灰色框以显示按钮
我正在尝试在 foldersystem 中使用 os.walk() 找到几个 'my_file.bat',如果文件名匹配它应该用 subprocess.call() 或 .run() 调用。问题是 o
我有一个端点,我可以在其中请求我使用 Siesta 查询的多条数据(例如 https://example.com/things?ids=1,2,3) .如果我只缓存了一些 things ,我试图弄清楚
这是我的代码: public static function test(){ try{ $apiContext = ApiContext::create(
我使用 PHP 在需要时传递登录表单,代码如下: $htmlForm = ''.''; switch(LOGIN_METHOD) { case 'both': $htmlFor
我正在使用 nginx-lua带有 redis 的模块提供 ember-app 的静态文件. index文件内容存储在redis作为 value由 nginx 正确提供服务当(根)domain/IP被
我是一名优秀的程序员,十分优秀!