- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在寻找管理我的产品在网络上下载的最佳方法。每个的重量在 2 到 20 Go 之间。我们的客户每天大约下载这些文件 1 到 1000 次。
我尝试过使用 Amazon S3,但下载速度不好,而且很快就会变得昂贵。我尝试过使用 Amazon S3 + CloudFront,但文件太大且下载次数太少:文件没有保留在缓存中。另外,我无法在 S3 中创建 torrent 文件,因为文件太大。我猜云解决方案(例如 S3、Azure、Google Drive...)仅适用于小文件,例如图像/css/等。
现在,我正在使用自己的服务器。它工作得很好,但管理起来确实更复杂......
有没有更好、更完美的方式来管理此类下载?
最佳答案
这是一个巨大的问题,我们在与电影或媒体行业的人员打交道时看到了这一点:他们生成巨大的视频文件,需要在紧迫的时间内共享。其中一些采用物理运输硬盘驱动器的方式。
当需要“有序且有保证的数据传输”时(例如 HTTP、FTP、rsync、nfs 等),网络传输通常使用 TCP 执行。但 TCP 实现对数据包丢失、往返时间 (RTT) 以及发送方和接收方之间的管道大小非常敏感。一些 TCP 实现也很难填充大管道(最大带宽延迟乘积的限制;BDP = 比特率 * 传播延迟)。
理想的解决方案需要解决所有这些问题。
减少 RTT 通常意味着减少发送方和接收方之间的距离。根据经验,将 RTT 减少一半可以使最大吞吐量加倍(或将周转时间减半)。仅供引用,我看到从美国东海岸到美国西海岸的 RTT 约为 80-85 毫秒。
大型部署通常使用 Akamai 或 AWS CloudFront 等内容交付网络 (CDN) 来减少 RTT(例如约 5-15 毫秒)。简而言之,CDN 服务提供商与本地/区域电信公司安排在许多城市部署本地内容缓存服务器,并向您出售使用它们的权利。
但是对缓存资源的生存时间 (TTL) 的控制可能取决于您的服务级别协议(protocol) ($)。而且缓存内存不是无限的,因此可能会清除空闲资源,为新请求的数据腾出空间,特别是在与其他人共享缓存的情况下。
就您的情况而言,在我看来,您希望有意义地减少 RTT,同时保留对缓存行为的完全控制,因此您可以设置非常长的缓存 TTL。 IMO 中最好的性价比解决方案是部署自己的运行 CentOS 7 + NGINX 的缓存服务器,并打开 proxy_cache 和足够的磁盘空间,并为每个主要区域(例如西海岸和东海岸)部署一个缓存服务器。您的最终用户可以选择距离他们最近的区域,或者您可以添加一些代码来自动检测最近的区域缓存服务器。
在 AWS EC2 上部署这些缓存服务器绝对是一个选择。您的最终用户可能会看到比直接连接到 AWS S3 更好的性能,并且没有带宽上限。
对于您的卷,当前的 AWS 定价约为 0.09 美元/GB(对于 Internet 上的 BW)。假设您有大约 50 个文件,平均大小为 10GB,那么从缓存服务器到最终用户的 BW 约为每月 50 美元 - 不错吧?对于低/平均使用率区域(79 美元/月),您可以从 c4.large 开始。使用率较高的区域可能会花费您约 150 美元/月 (c4.xl)、约 300 美元/月 (c4.2xl) 等。您可以通过竞价实例获得更好的定价,并且可以根据您的业务模式(例如 VIP)调整性能与尽力而为)。
就能够“填充管道”和对网络丢失的敏感性(例如拥塞控制、拥塞避免)而言,您可能需要考虑像 SuperTCP 这样的优化 TCP 堆栈(完全免责声明,我是开发总监) )。这里的想法是拥有一个每个连接自动调整的 TCP 堆栈,背后有大量的工程,因此它可以填充像 AWS 区域之间的巨大管道,并且不会像常规 TCP 那样对网络丢失 react 过度,尤其是在发送到 Wi-Fi 端点。
与 UDP 解决方案不同,它是单侧安装(<5 分钟),您无需支付硬件或存储费用,无需担心防火墙,并且不会淹没/杀死您自己的防火墙网络。您需要将其安装在发送设备上:区域缓存服务器和将新请求推送到缓存服务器的源服务器。
优化的 TCP 堆栈可以将健康网络的吞吐量提高 25%-85%,而且我在糟糕的网络上见过 2 到 10 倍的吞吐量。
关于azure - 管理大文件下载的最佳方式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32379930/
我会尽可能地解释我正在做的事情,以获得最好的可能的建议/解决方案。这一切都是在 java 中完成的。 我的客户有一个基于 SWING 的桌面应用程序,它将使用 WebStart 加载。我被指派为用户帐
看来这个page包含 Azure CLI 支持的与 Azure API 管理相关的所有功能。但它没有展示如何使用 Azure CLI 管理用户、产品、证书、订阅和 API 等实体。 Azure CLI
我设置了一个 Hadoop 1.2.x 版本,双节点集群。第一节点(NameNode、Jobtracker)和第二节点(Secondary NameNode、Datanode、TaskTracker)
对于内容驱动的网站,设计好坏的关键是关系型数据库。在这个教程中,我们已经使用了MySQL关系型数据库管理系统(RDBMS)建立了我们的数据库。对于网站的开发者来说,MySQL是一个较受欢迎的选择,这
在尝试运行MariaDB之前,首先确定其当前状态,运行或关闭。 有三个选项用于启动和停止MariaDB – 运行mysqld(MariaDB脚本)。 运行mysqld_safe启动脚本。
我在管理界面中遇到 StackedInlines 前缀的问题。我会尝试发布所有必要的代码。 models.py(简要) ##### Base classes class BaseItem(models
我是新来的。到目前为止,我一直在使用 MVC 模型并使用基本的 session 管理模型,即在 session 中存储一个 token 并检查每个请求。 我正在尝试对lift做同样的事情,但我的 se
我在 win 服务中使用 NHiberante。有时我得到 System.ObjectDisposedException: Session is closed! Object name: 'ISess
我正在尝试使用 HtmlUnit 登录 Facebook 页面并查看其 HTML 内容。我正在尝试通过 HtmlUnit 填写登录凭据,但在单击提交按钮时我没有看到正在执行的 session 。 在
我正在为一个相当大的项目开发一个带有 reactjs 的前端,该项目有两个主要接口(interface)。主站点的前端和管理员的前端。 我应该将它们开发为两个不同的项目还是 reactjs 中的一个项
短版 我有一个使用插件基础结构的应用程序。插件具有可配置的属性,可帮助它们了解如何完成工作。插件按配置文件分组以定义如何完成任务,配置文件存储在由 DataContractSerializer 序列化
如何管理 iPhone 应用程序中的用户 session ?我在应用程序的第一页上从用户那里获取了用户名和密码。用户可以随时注销。如何像其他 Web 应用程序一样在 iPhone 应用程序中存储 se
我正在使用 Azure API 管理,其中包含第三方论坛 (Discourse) 的链接。 api管理提供的默认登录系统用于注册用户。我想知道是否可以对 api 管理和论坛使用单点登录,这样用户就不必
我正在使用 Wordpress 建立一个网站,并且我想利用它的 session 。但我没有找到任何插件,甚至文档。在我开始破解之前有什么建议或引用吗? 注意:我问的是 WP 是否以及如何使用标准 PH
我已阅读《Azure in Action》一书中的以下内容:“在 Windows Azure 中,状态服务器或进程外 session 状态提供程序,不支持” 谁能告诉我为什么不支持这个。他们在书中没有
我有一个内联表单集,我想排除一些模型对象在表单集中显示。 例如。模型 B 具有模型 A 的外键,因此它是 1:n(A 对象有许多 B 对象)关系。现在在 A 管理编辑页面上,我已经获得了 B 的内联。
我正在开发一个基于 session 的项目。我在想,与银行类似,我会创建一张支票并为用户提供阻止 session 超时的能力。 我正在考虑创建一个 setInterval 来检查需要身份验证的空白页面
我正在为一位拥有 Magento 商店的客户工作。里面塞满了产品,但这些产品的名称有点乱。他并没有坚持一种命名约定,而是多年来使用了不同的约定。因此,每当他使用“管理”->“管理产品”部分中的“名称”
我使用大约十几个 XSLT 文件来提供大量输出格式。目前,用户必须知道导出的文件格式的扩展名,例如RTF、HTML、TXT。 我还想使用参数来允许更多选项。如果我可以将元数据嵌入 XSL 文件本身,那
我已阅读《Azure in Action》一书中的以下内容:“在 Windows Azure 中,状态服务器或进程外 session 状态提供程序,不支持” 谁能告诉我为什么不支持这个。他们在书中没有
我是一名优秀的程序员,十分优秀!