gpt4 book ai didi

filesystems - 是否有任何正在积极开发的分布式高可用性文件系统(用于 Linux)?

转载 作者:行者123 更新时间:2023-12-04 03:24:58 24 4
gpt4 key购买 nike

有没有分布式、高可用性文件系统 (对于Linux)正在积极开发?

让我更具体一点:

  • 分布式意味着它可以优雅地处理客户端到服务器的延迟,就像您在全局公共(public)互联网上发现的那样(300 毫秒及以上很常见)和偶尔的连接不稳定。这意味着需要非常好的客户端缓存(即带有回调)。 NFS 不这样做。这也意味着无需 IPSEC VPN 即可对在线数据进行加密。
  • 高可用 意味着数据可以存储在多个服务器上,并且客户端足够聪明,可以在遇到问题时尝试另一台服务器。将这种智能放在客户端中非常重要,这就是为什么不能将这类东西移植到 NFS 上的原因。对于只读数据,这至少需要是可能的。这对于读写数据会很好,但我知道这很难。
  • 文件系统 意味着内核驱动程序导出 POSIX 接口(interface)和权限和访问控制是在面对不可信的客户端时强制执行的。 SAN 系统通常假定客户端是值得信赖的。

  • 我是 OpenAFS 难民。我喜欢它,但在这一点上,我不能再接受它要求所有文件服务器在所有其他文件服务器上有效地“拥有根”。专有磁盘格式和必须运行 Kerberos 基础设施(否则我不需要)的开销也变得越来越成问题。

    除了 OpenAFS 之外,还有其他系统具有这些属性吗?间奏曲和尾声可能符合条件,但不再是活跃的项目。 Lustre 很酷,但似乎是为超低延迟数据中心设计的。 Ceph 很棒,但不是真正的文件系统,更多的是在文件系统下运行的东西(是的,有 CephFS,但它确实是 Ceph 的展示,并且明确没有生产就绪,并且没有时间表)。 Tahoe-LAFS 很酷,但它和 GoogleFS 并不是真正的文件系统,因为它们不会通过内核模块导出 POSIX 接口(interface)。我对 GFS(全局文件系统)的理解是客户端可以直接操作磁盘上的数据结构,因此它们是隐含的根级受信任的(这就是它快速的部分原因)——如果我错了,请纠正我这里。

    需要开源,因为我不能将我的数据锁定在专有的东西中。我不介意为软件付费,但在这种情况下我不能成为人质。

    谢谢,

    最佳答案

    首先,您可以使用本地文件系统(使用 -o user_xattr 安装)使用 cachefilesd(由 cachefilesd 上的 Debian 包提供)到 fscache 缓存 NFS(使用 -o fsc 安装)设施。

    尽管您正在寻找的文件系统可能不存在,IMHO两个项目非常接近,相当不错FUSE客户端实现:

  • LizardFS (GPL-3 许可,托管在 Github ),现在专有 MooseFS 的分支。
  • Gfarm file system (BSD/Apache-2.0,托管在 SourceForge )

  • 在对 Ceph 进行了一段时间的评估后,我得出的结论是它存在缺陷(在可预见的将来没有改进的希望)并且不适合认真使用。 XtreemFS 也令人失望。我希望即将到来的 OrangeFS第 3 版( promise 进行数据完整性检查)可能还不错,但这还有待观察……

    关于filesystems - 是否有任何正在积极开发的分布式高可用性文件系统(用于 Linux)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23032955/

    24 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com