gpt4 book ai didi

apache - (Apache) 将 inode 放入 ETag 的目的是什么?

转载 作者:可可西里 更新时间:2023-11-01 15:12:24 25 4
gpt4 key购买 nike

网络上有很多文章详细说明了为什么您可能不想为 ETag 使用 Apache 的默认 inode-mtime-size 格式。

但是我还没有读到任何关于最初可能促使 Apache 包含 inode 的内容。从表面上看,它似乎只有在需要能够区分同一资源的八位字节对八位字节传真时才有用,但这肯定与 ETag 的目的背道而驰。

Apache 的作者并不以草率地处理 Internet 标准而闻名,所以我觉得我一定遗漏了一些东西。谁能详细说说?

编辑: 我在这里而不是在 ServerFault.com 上问这个问题,因为我正在实现一个 Web 服务器而不是管理一个。要详细了解为什么这是一个坏主意,请参见例如herehere .所有此类文章都推荐同一件事:从您的 etag 中删除 inode。问题是,他们在那里有什么好处吗?

最佳答案

这似乎是人们很容易通过对常见情况的错误猜测,或者默认情况下更喜欢正确性而不是性能来做的事情,只要有一丝怀疑。

请允许我编一个关于它可能如何消失的故事:

出于性能原因,他们很早就决定对内容进行哈希/校验和不是一个好主意。 “谁知道文件有多大?我们不能一直重新计算这些……”所以他们决定大小和日期让你非常接近。

“等等,”A 说,“没有什么能保证不会发生文件大小冲突。事实上,在某些情况下,例如固件二进制文件,文件大小始终相同,这完全有可能多个是同时从开发机器上传的,所以这些不足以区分不同的内容。”

B:“嗯,说得好。我们需要一些与文件内容有内在联系的东西。加上修改时间,可以确定它是否是相同的内容。”

A:“inode 怎么样?现在,即使他们重命名文件(例如,他们可能将“推荐”更改为不同的文件),默认的 etag 也可以正常工作!”

B:“我不知道,inode 好像有点危险。”

A 人:“嗯,什么会更好?”

B:“是的,问得好。我想我想不出具体有什么问题,我只是有一种普遍的不好的感觉。”

A 人:“但至少它保证你会在它发生变化时下载一个新的。最糟糕的情况是你下载的次数超过了你需要的次数,而任何知道的人都不必担心它可以把它关掉。”

B:“是的,这是有道理的。对于大多数情况来说,这可能没问题,而且似乎比简单的替代方案更好。”

免责声明:我对 Apache 实现者的想法一无所知。这一切都只是徒手猜测,并试图编造一个似是而非的故事。但我确实经常看到这种事情发生。

您永远不知道您没有想到的是什么(在这种情况下,为相同文件提供服务的冗余负载平衡服务器比不必担心大小+时间冲突更为典型)。负载均衡器不是 apache 的一部分,因此更容易进行此类监督。

此外,这里的故障模式是您没有完全有效地使用缓存(不是您得到了错误的数据),这可以说是更好的,尽管很烦人。这表明,即使他们确实想到了,他们也可以合理地假设有足够兴趣设置负载均衡器的人也可以调整他们的配置细节。

PS:这与标准无关。没有指定您应该如何计算 etag,只是它应该足以判断内容是否已更改,而且概率很高。

关于apache - (Apache) 将 inode 放入 ETag 的目的是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1489289/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com