python - 如何避免使网络服务器成为 cassandra 的瓶颈？-6ren

python - 如何避免使网络服务器成为 cassandra 的瓶颈？

转载作者：行者123 更新时间：2023-11-30 23:50:32

26

4

我是 Cassandra 新手，所以请耐心等待。

所以，我正在使用 Cassandra 作为数据库构建一个搜索引擎。我通过 Pycassa 与它交互。

现在，我想输出 Cassandra 对网页的响应，让用户提交查询。

我知道 django、fastCGI、SCGI 等工具可以允许 python 与 Web 交互。然而，如何在网络服务器上运行 python 脚本而不将该服务器变成单点故障(即，如果该服务器死机，则用户无法访问系统)，从而否定 Cassandra 的一个目的？

最佳答案

我以前见过这个问题 - 有时人们需要更多的 CPU 能力和带宽来生成和服务一些服务器生成的 HTML 和图像，而不是在 Cassandra 中运行实际查询。对于一位客户来说，为网站前端提供服务的服务器数量是其 Cassandra 集群中的服务器数量的十倍之多。

您需要以某种方式在这些前端服务器之间实现负载平衡 - 研究在一些专用计算机上运行 haproxy。它的配置快速且简单，并且在您的设置发生更改时也同样可以轻松地重新配置(与 DNS 不同，DNS 可能需要几天的时间才能传播更改)。我想你也可以配置 nginx 来做同样的事情。如果您将每个 session 的信息保留在前端服务器中，则需要每个客户端针对每个请求都转到同一前端服务器 - 这称为“ session 持久性”，可以通过对客户端的 IP 进行散列来选择来实现前端服务器。 Haproxy 会为你做这件事。

然而，这种方法将再次在您的配置(haproxy 服务器)中创建 SPOF - 您应该运行多个，并且可能有一个热备用。最后，您需要以某种方式平衡 haproxy 之间的负载 - 我们通常为此使用循环 DNS，因为运行 haproxy 的节点很少发生变化。

该系统的好处是您可以轻松地增加(和减少)前端服务器的数量，而无需更改 DNS。您可以阅读(一点点)有关我所指的设置的更多信息:http://www.acunu.com/blogs/andy-ormsby/using-cassandra-acunu-power-britains-got-talent/

关于python - 如何避免使网络服务器成为 cassandra 的瓶颈？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/7140661/

26

4

0

文章推荐： asp.net - 内容特定的 JavaScript 和母版页

文章推荐： php - Javascript 在初始页面加载时不加载

MySQL 瓶颈
我有一个具有以下结构的表: ID, SourceID, EventId, Starttime, Stoptime 所有 ID 列都是 char(36)，时间是日期。问题是查询表真的很慢。我有 7 百
.net - WCF服务路由，瓶颈？
我们的应用程序服务器架构经过设置，以便每个服务调用都经过自定义构建的 WCF 服务路由器 - 这是一个使用请求消息 header 中嵌入的信息将传入请求分发到适当服务的服务。我们在使用此 WCF 服
Java:ArrayList 瓶颈
在分析一个计算数千个元素的层次聚类的 Java 应用程序时，我意识到 ArrayList.get占用执行集群化部分所需 CPU 的一半左右。该算法搜索两个更相似的元素(因此它是 O(n*(n+1)/
arrays - MatLab 瓶颈
我正在处理大数组(~6x40 百万)，我的代码显示出很大的瓶颈。我在 MatLab 编程经验丰富，但对内部过程(如内存等......)知之甚少。我的代码如下(只是要点，当然所有变量都初始化了，特别是
c# - TcpClient 瓶颈
我正在尝试创建一个独立的类来维护与服务器的 Tcp 连接。我正在使用以下类变量: TcpClient tcpClient; NetworkStream networkStream; BinaryRe
c# - 多线程访问内存中的大型字典对象 - 瓶颈？
快速多线程问题... 我在内存中有一个包含大约 20,000 个项目的字典对象。如果我有多个线程尝试读取此对象，您会认为这会造成瓶颈吗？净 3.5 。字典对象将是只读的字典是只读的，所以我不关心读
javascript - Node 代理服务器，瓶颈？
我们有 2 台服务器: 文件 API 核心 API 不同服务器上的文件 API 和不同的核心 API。我们希望通过相同的域和端口进行访问，我们使用 nodeJS 作为后端平台。所以我们想出了一个代理
azure - 并行运行 Azcopy - 瓶颈？
我想并行下载/上传文件到 Azure。默认情况下，由于日志文件上的锁定，AzCopy 不允许在同一副本上多次运行。我通过将每个实例指向不同的日志文件(使用/Z )在同一台计算机上运行多个 Azcopy
performance - iTextSharp PDFWriter 瓶颈
因此，我将获取 10000 个 2 页 pdf 文件，并使用 iTextSharp 将它们合并为一个。这是我正在做的一些松散代码: Document document = new Document(
java - 使用多线程写入多个文件时如何解决 I/O 瓶颈
我目前有一个多线程程序，可以抓取网站并将其文本写入文件。 CPU 方面，我可以同时运行大量线程，但 I/O 很快就会成为瓶颈。我想我可以让每个线程写入数组阻塞队列，但我知道我将生成超过可用 32GB
c# - 了解树搜索中的 PLINQ 瓶颈
我在使用 PLINQ 时遇到了一些我似乎无法解释的奇怪结果。我一直在尝试并行化 Alpha Beta 树搜索以加快搜索过程，但它实际上减慢了搜索速度。我希望当我提高并行度时，我会每秒线性增加节点...
Python 瓶颈 argpartsort 性能
在对给定数组中的前 n = 1000 个元素进行排序时，为什么 bottleneck.argpartsort 具有最佳性能是否有原因(考虑到我没有搞砸某些事情)？我创建了以下脚本: d = nump
c++ - 如何剖析 OpenMP 瓶颈
我有一个已由 OpenMP 并行化的循环，但由于任务的性质，有 4 个 critical 子句。分析加速并找出哪些关键子句(或可能非关键(!))在循环内占用最多时间的最佳方法是什么？我使用 Ubu
ios - 如何找到 UIImage 瓶颈
我有一个使用 UIImage 对象的应用程序。到目前为止，我一直在使用像这样初始化的图像对象: UIImage *image = [UIImage imageNamed:imageName]; 在我的
mysql - 如何衡量 mySQL 瓶颈？
对于以下问题场景，我们应该查看哪些 mySQL 服务器变量以及哪些阈值很重要: CPU 限制磁盘读取限制磁盘写入绑定(bind) 对于每种情况，除了获得更好的硬件或将数据库扩展到多台服务器之外，建
vba - 识别 VBA UDF 瓶颈
在我的工作表中，我有四个不同的类别。对于每个类别，有 3~5种不同的价格。还有其他属性。结果，每个类别都重复了很多次，总共有 30,000 行。工作表的第一行包含所有列名。每个类别跨越连续的行。因此，
r - createDataFrame 中的 SparkR 瓶颈？
我是 Spark、SparkR 以及所有 HDFS 相关技术的新手。我最近安装了 Spark 1.5.0 并使用 SparkR 运行一些简单的代码: Sys.setenv(SPARK_HOME="/p
solrnet - solr.Add(doc) 瓶颈
Win 7/SolrNet 0.4.0/C# winforms .net 4.0 客户端。我正在使用 Solrnet 和一个 winforms 线程应用程序将多个位图和一些数学描述符写入 Solr
java - Android - 位置管理器 requestLocationUpdates 瓶颈
我有一个 Android 后台服务，它会不时报告位置。当我通过 wifi 在本地测试时它工作得很好，但是当在 3G 连接中测试时(有时在 Edge 上)我发现应用程序显然进入了瓶颈并且不执行 onLo
javascript - angular.js $apply 瓶颈
我正在使用实时数据在网页上使用 SVG 绘制一些线条。为了管理数据，我使用 Angular.js 并管理可视化，我使用 D3.js。我设置了一个 Angular Controller 来保存数据(行

首页

博学

6Ren·AI

商城

python - 如何避免使网络服务器成为 cassandra 的瓶颈？