gpt4 book ai didi

indexing - 倒排索引和普通旧索引有什么区别?

转载 作者:行者123 更新时间:2023-12-03 05:00:16 31 4
gpt4 key购买 nike

在软件工程中,我们一直在创建索引(例如,在数据库中),但我也听到很多人谈论倒排索引。两者之间有什么根本不同吗?它们听起来像是同一件事。

最佳答案

一种常见用途是 "...to allow fast full-text searching."

这两种类型表示方向性 .一带你转发 通过索引,另一个带你向后 (逆)通过索引。就是这样。这里没有什么 secret 可以揭开。否则这两种类型是一样的,只是你提供什么信息的问题 ,因此您想要获取哪些信息 找到。

为了解决您的疑问,我认为实际上没有一种方法可以知道为什么使用今天。定义哪个很重要的唯一原因是 forward哪个是inverted这样我们都可以就他们进行对话,每个人都知道我们在谈论哪个方向。想想术语“左”和“右”:它们是相对的。哪个不重要,除了每个人都需要同意哪个是“左”,哪个是“右”才能使这些词有意义。如果,作为一种文化,我们决定左右翻转,那么你会遇到同样的问题,因为商定的含义已经改变,因此要弄清楚“右转”与“左转”是什么意思。然而,命名是任意的,所以哪个是哪个(本身)并不重要——重要的是我们都同意 在意义上。

在您提出“请不要只定义术语”的评论中,您没有捕获重点,我认为当它们之间完全没有区别时,您只是对措辞感到困惑。

为了将来读者的利益,我现在将提供几个“正向”和“反向”索引示例:

示例 1:网络搜索

如果您认为索引的倒数类似于 inverse of a function in mathematics ,其中逆是具有不同形式的特殊事物,那么您就错了:这里不是这种情况。

在搜索引擎中,您有一个文档列表(网站上的页面),您可以在其中输入一些关键字并返回结果。

forward index (或只是索引)是 文件 list , 以及出现在其中的单词。在网络搜索示例中,Google 抓取网络,构建文档列表,确定每个页面中出现哪些词。

inverted index单词列表 ,以及它们出现的文档。在网络搜索示例中,您提供单词列表(您的搜索查询),然后 Google 生成文档(搜索结果链接)。

它们都是指数——这只是你要往哪个方向发展的问题。前向是从文档->到->单词,反向是从单词->到->文档。

示例 2:DNS

另一个示例是 DNS 查找(采用主机名,并返回 IP 地址)和反向查找(采用 IP 地址,并为您提供主机名)。

示例 3:一本书

书后的索引实际上是倒排索引 ,如上述示例所定义 - 单词列表,以及在书中的何处找到它们。在一本书中,目录就像一个远期指数 :这是本书包含的文档(章节)列表,除了列出这些部分中的单词外,目录仅给出了这些文档(章节)中包含的内容的名称/一般描述。

示例 4:您的手机

远期指数在您的手机中是您的联系人列表,以及哪些电话号码(手机、家庭、工作)与这些联系人相关联。 倒排索引是什么允许您手动输入电话号码,当您点击“拨号”时,您会看到此人的姓名,而不是号码,因为您的手机已获取电话号码并找到与之关联的联系人。

关于indexing - 倒排索引和普通旧索引有什么区别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7727686/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com