- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我一直在研究将分布式文件系统与我的专用服务器一起使用而不是使用 Amazon S3 的想法,结果除了让我头疼之外别无其他!
我的项目有以下特点/要求:
用户文件存储在专用服务器。每个文件存储在 2 台独立的机器中,位于不同的数据中心(彼此相距 150-200 英里)
我正在使用 Amazon RDS 托管关联的 mysql 数据库 (*)。它相当紧凑(仅包含 ID/文件元数据)
文件/数据约为 50TB。当然,数据确实会发生变化,并且肯定会随着时间的推移而增长
我的问题是:是否有一个良好的通用分布式并行容错文件系统具有以下特点:
稳定且相当快(上传/下载)
设置和维护相当容易
处理数据存储,以便我仅需要关心删除/添加新服务器(即通过编辑简单配置将新服务器添加到文件系统的服务器池,或类似的东西)
我读过有关 OpenStack、GlusterFS、MogileFS、XtreemFS 等的信息……但我读得越多,就越感到困惑!
(*) 是的,我意识到矛盾。在成本方面,将数据库托管在 RDS 上确实有意义。但是,与使用专用服务器(前提是它足够好)相比,在亚马逊上存储(最多)50TB 的用户文件过于昂贵。
PS.我的应用还没有上线,所以如果有人有适合我的情况的好主意,我愿意接受建议。
编辑 我不是尝试制作 S3 克隆,我只需要使用现有的托管基础设施来构建小型云解决方案,我的问题是关于找到合适的分布式文件系统来处理/自动执行此操作。
最佳答案
我们最近从昂贵的存储解决方案切换到用于分布式存储解决方案的开源 Lizardfs。一旦您理解了基本概念,设置和扩展就非常简单。
查看 https://docs.lizardfs.com/introduction.html#architecture快速概览。但是暂时忘掉 shadow master en meta loggers。你需要知道的是,有
一个master:调节流量(确保有足够的cpu)
chunkservers:实际存储数据。使用带有一堆硬盘的任何现成硬件。
客户端:它们只是简单的挂载点。因此,如果需要,您可以获得 50TB 的巨型安装座。主人会告诉客户在哪里找到/存储文件。实际数据直接从客户端-> block 服务器传输并返回。
您可以根据需要添加任意数量的 chunkservers,master 将自动尝试在它们之间平衡您的存储使用量。添加存储是添加硬盘驱动器或添加服务器的问题。它们不一定是真正的裸机,但这可能是最便宜的。
lizardfs 中有 2 个令人惊奇的特性允许异地复制。
这些相同的目标也可用于执行地理复制。您通过相应地标记您的 block 服务器来定义您的数据必须存储在至少两个不同的位置。 (例如 DC1 和 DC2)
lizardfs 的易用性是我的卖点。我听说过关于 Ceph 的好消息,但设置它是另一回事......
一开始让我担心的是这项技术是如何被证明的。所以我花了很多研究来弄清楚谁在使用它。Orange Poland(一家大型电信提供商)是用户之一。和 Cloudweavers/opennebula实际上围绕它建立了业务selling complete solutions .
关于linux - 就我而言,好的分布式通用文件系统?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9964781/
我有这个代码: System.err.print("number of terms = "); System.out.println(allTerms.size()); System.err
我有以下问题:在操作系统是 Linux 的情况下和在操作系统是 MacOs 的情况下,我必须执行不同的操作。 所以我创建了以下 Ant 脚本目标: /u
我正在调用 system("bash ../tools/bashScript\"This is an argument!\"&"),然后我正在调用 close(socketFD) 直接在 system
使用最初生成的随机元素来约束随机数组的连续元素是否有效。 例如:我想生成一组 10 个 addr、size 对来模拟典型的内存分配例程并具有如下类: class abc; rand bit[5:0
我正在创建一个必须使用system(const char*)函数来完成一些“繁重工作”的应用程序,并且我需要能够为用户提供粗略的进度百分比。例如,如果操作系统正在为您移动文件,它会为您提供一个进度条,
我即将编写一些项目经理、开发人员和业务分析师会使用的标准/指南和模板。目标是更好地理解正在开发或已经开发的解决方案。 其中一部分是提供有关记录解决方案的标准/指南。例如。记录解决/满足业务案例/用户需
在开发使用压缩磁盘索引或磁盘文件的应用程序时,其中部分索引或文件被重复访问(为了论证,让我们说一些类似于 Zipfian 分布的东西),我想知道什么时候足够/更好地依赖操作系统级缓存(例如,Debia
我们编写了一个 powershell 脚本,用于处理来自内部系统的图像并将其发送到另一个系统。现在,业务的另一部分希望加入其中,对数据进行自己的处理,并将其推送到另一个系统。打听了一下,公司周围有几个
我正在尝试朗姆酒我的应用程序,但我收到以下错误:System.Web.HttpUnhandledException:引发了“System.Web.HttpUnhandledException”类型的异
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的,
所以我在其他程序中没有收到此错误,但我在这个程序中收到了它。 这个程序是一个我没有收到错误的示例。 #include int main() { system("pause"); } // en
我在 c# System.URI.FormatExption 中遇到问题 为了清楚起见,我使用的是 Segseuil 的 Matlab 方法,并且它返回一个图片路径 result。我想为其他用户保存此
我正在尝试像这样设置文本框的背景色: txtCompanyName.BackColor = Drawing.Color.WhiteSmoke; 它不喜欢它,因为它要我在前面添加系统,例如: txtCo
请帮助我解决 System.StackOverflowException我想用 .aspx 将记录写入数据库我使用 4 层架构来实现这一切都正常但是当我编译页面然后它显示要插入数据的字段时,当我将数据
我使用了一些通常由系统调用的API。 因此,我将 android:sharedUserId="android.uid.system" 添加到 manifest.xml, 并使用来自 GIT 的 And
我正在尝试创建一个小型应用程序,它需要对/system 文件夹进行读/写访问(它正在尝试删除一个文件,并创建一个新文件来代替它)。我可以使用 adb 毫无问题地重新挂载该文件夹,如果我这样做,我的应用
我想从没有 su 的系统 priv-app 将/system 重新挂载为 RW。如何以编程方式执行此操作?只会用 Runtime.getruntime().exec() 执行一个 shell 命令吗
我正在尝试制作一个带有登录系统的程序我对此很陌生,但我已经连续工作 8 个小时试图解决这个问题。这是我得到的错误代码 + ServerVersion 'con.ServerVersion' threw
当我“构建并运行”Code::Blocks 中的程序时,它运行得非常好!但是当我从“/bin”文件夹手动运行它时,当它试图用 system() 调用“temp.bat”时,它会重置。这是为什么?它没有
我想使用 system/pipe 命令来执行具有特殊字符的命令。下面是示例代码。通过系统/管道执行命令后,它通过改变特殊字符来改变命令。我很惊讶地看到系统命令正在更改作为命令传递的文本。 run(ch
我是一名优秀的程序员,十分优秀!