gpt4 book ai didi

algorithm - 搜索引擎不精确计数(大约 xxx 个结果)

转载 作者:塔克拉玛干 更新时间:2023-11-03 03:39:25 25 4
gpt4 key购买 nike

当您在 Google 中搜索时(我几乎可以肯定 Altavista 做了同样的事情),它会显示“关于 xxxx 的结果 1-10”...

这一直让我感到惊讶......“关于”是什么意思?
他们怎么能算粗呢?
我确实理解为什么他们不能在合理的时间内得出一个精确的数字,但他们是如何达到这个“近似”数字的呢?

我敢肯定这背后有很多我错过的理论......

最佳答案

它很可能类似于大多数 SQL 系统在其查询计划中使用的那种估计行数;表中的行数(在上次收集统计数据时确切知道,但通常不是最新的)乘以估计的选择性(通常基于通过对一些小子集进行抽样计算的一种统计分布模型行数)。

PostgreSQL 手册有一节关于 statistics used by the planner这是相当有用的信息,至少如果您点击指向 pg_stats 和其他各个部分的链接。我敢肯定,这并没有真正描述谷歌所做的事情,但它至少展示了一个模型,您可以在其中获得前 N 行,并估计可能还有多少行。

关于algorithm - 搜索引擎不精确计数(大约 xxx 个结果),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/146980/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com