- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
所有,请原谅我,我才刚刚开始学习如何使用 SOLR
。强大的SE。而且我已经知道 倒排索引
是 SOLR
中搜索速度如此之快的原因。在许多阅读。就像 Solr in action
,Apache Solr 搜索模式
。倒排索引如下所述。
而且我还知道 Document
是由 Fields
组成的。在我对上面数据结构的理解中。当使用特定术语(如“Harry”)进行搜索时。 SE 将返回结果文档 1,2。我对此毫无疑问。
但是当我阅读 guide from apache .它说
Analysis takes place in two contexts. At index time, when a field is being created, the token stream that results from analysis is added to an index and defines the set of terms (including positions, sizes, and so on) for the field. At query time, the values being searched for are analyzed and the terms that result are matched against those that are stored in the field's index.
我对这篇文章感到困惑。
倒排索引指向的是文档还是字段?在我提到的图表中。它没有提到任何关于领域的事情。它只是说索引指向文档 ID。但在阅读中我引用了。它确实告诉我们倒排索引指向的是字段而不是文档。 (如果我错了。请纠正我。)谢谢。
最佳答案
我理解您的困惑,这是文献解释手头主题过度简化的案例之一。大多数文献解释和倒排索引使用的文档只是文本,因此(如图所示)一个文档只是一系列字符,不存在其他“字段”。
当您解释倒排索引是什么时,这会很有用,但当您与实际实现(如 Lucene/ES/Solr 提供的实现)交互时,实际情况会有所不同。
也许 this post可能会有用,如果你一直往下看,阅读会有点密集,但如果你只是想捕获要点,不要试图一口气读懂所有内容。请注意,Lucene 实现包含更多技术细节,例如,以确保性能和减少磁盘使用。
最重要的是,基本上每个字段本身就像一个“迷你倒排索引”,并允许知道与您的查询匹配的文档的哪个特定“部分/字段”,因此您可以影响您的分数(通常结果是如何排序的)相应地。如果你总是有平面文件,搜索引擎就不会那么有用了。
关于apache - SOLR中倒排索引的数据结构到底长什么样,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33929377/
我目前正在尝试基于哈希表构建字典。逻辑是:有一个名为 HashTable 的结构,其中包含以下内容: HashFunc HashFunc; PrintFunc PrintEntry; CompareF
如果我有一个指向结构/对象的指针,并且该结构/对象包含另外两个指向其他对象的指针,并且我想删除“包含这两个指针的对象而不破坏它所持有的指针”——我该怎么做这样做吗? 指向对象 A 的指针(包含指向对象
像这样的代码 package main import "fmt" type Hello struct { ID int Raw string } type World []*Hell
我有一个采用以下格式的 CSV: Module, Topic, Sub-topic 它需要能够导入到具有以下格式的 MySQL 数据库中: CREATE TABLE `modules` ( `id
通常我使用类似的东西 copy((uint8_t*)&POD, (uint8_t*)(&POD + 1 ), back_inserter(rawData)); copy((uint8_t*)&PODV
错误 : 联合只能在具有兼容列类型的表上执行。 结构(层:字符串,skyward_number:字符串,skyward_points:字符串)<> 结构(skyward_number:字符串,层:字符
我有一个指向结构的指针数组,我正在尝试使用它们进行 while 循环。我对如何准确初始化它并不完全有信心,但我一直这样做: Entry *newEntry = malloc(sizeof(Entry)
我正在学习 C,我的问题可能很愚蠢,但我很困惑。在这样的函数中: int afunction(somevariables) { if (someconditions)
我现在正在做一项编程作业,我并没有真正完全掌握链接,因为我们还没有涉及它。但是我觉得我需要它来做我想做的事情,因为数组还不够 我创建了一个结构,如下 struct node { float coef;
给定以下代码片段: #include #include #define MAX_SIZE 15 typedef struct{ int touchdowns; int intercepti
struct contact list[3]; int checknullarray() { for(int x=0;x<10;x++) { if(strlen(con
这个问题在这里已经有了答案: 关闭 11 年前。 Possible Duplicate: Empty “for” loop in Facebook ajax what does AJAX call
我刚刚在反射器中浏览了一个文件,并在结构构造函数中看到了这个: this = new Binder.SyntaxNodeOrToken(); 我以前从未见过该术语。有人能解释一下这个赋值在 C# 中的
我经常使用字符串常量,例如: DICT_KEY1 = 'DICT_KEY1' DICT_KEY2 = 'DICT_KEY2' ... 很多时候我不介意实际的文字是什么,只要它们是独一无二的并且对人类读
我是 C 的新手,我不明白为什么下面的代码不起作用: typedef struct{ uint8_t a; uint8_t* b; } test_struct; test_struct
您能否制作一个行为类似于内置类之一的结构,您可以在其中直接分配值而无需调用属性? 前任: RoundedDouble count; count = 5; 而不是使用 RoundedDouble cou
这是我的代码: #include typedef struct { const char *description; float value; int age; } swag
在创建嵌套列表时,我认为 R 具有对列表元素有用的命名结构。我有一个列表列表,并希望应用包含在任何列表中的每个向量的函数。 lapply这样做但随后剥离了列表的命名结构。我该怎么办 lapply嵌套列
我正在做一个用于学习目的的个人组织者,我从来没有使用过 XML,所以我不确定我的解决方案是否是最好的。这是我附带的 XML 文件的基本结构:
我是新来的 nosql概念,所以当我开始学习时 PouchDB ,我找到了这个转换表。我的困惑是,如何PouchDB如果可以说我有多个表,是否意味着我需要创建多个数据库?因为根据我在 pouchdb
我是一名优秀的程序员,十分优秀!