- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我在一个研究平台上工作,该平台通过 Twitter API 读取相关的 Twitter 提要并将它们存储在 PostgreSQL 数据库中以供将来分析。中间件是 Perl,服务器是 HP ML310,8GB 内存,运行 Debian linux。
问题是 twitter 提要可能非常大(每秒很多条目),我不能等待插入再返回等待下一条推文。所以我所做的是使用 fork(),这样每条推文都会有一个新进程插入到数据库和监听器中,并快速返回以获取下一条推文。然而,由于这些进程中的每一个都有效地打开了一个与 PostgreSQL 后端的新连接,系统永远无法 catch 其 Twitter 提要。
如果有必要,我愿意使用连接池建议和/或升级硬件来完成这项工作,但我将不胜感激任何建议。这可能是 RAM 限制,还是有配置或软件方法我可以尝试使系统足够快?
最佳答案
如果您为每个 插入打开和关闭一个新连接,那将会造成很大的损失。您应该改用连接池。创建新的数据库连接并不是一件轻量级的事情。
为每个插入执行一个 fork() 可能也不是一个好主意。您不能创建一个只负责插入并在套接字上监听或扫描目录或类似内容的进程,以及另一个向插入进程发出信号的进程(经典的生产者/消费者模式)。或者使用某种消息队列(我不会Perl,所以我不能说那里有什么样的工具)。
当进行批量插入时,在单个事务中执行它们,最后发送提交。不要提交每个插入。另一种选择是将行写入文本文件,然后使用 COPY
将它们插入数据库(没有比这更快的了)。
您还可以稍微调整 PostgreSQL 服务器。如果您可以承受在系统崩溃时丢失一些事务,您可能希望关闭 synchronous_commit
。
如果您可以随时从头开始重建表格(例如通过重新插入推文),您可能还希望将该表格设为“未记录”表格。它在写入方面比普通表更快,但如果 Postgres 没有干净地显示下来,您将丢失表中的所有数据。
关于perl - PostgreSQL 阻塞太多插入,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14267070/
对于一个简单的聊天程序,我使用了一个通过 boost::python 包装的 c 库。 使用 PyQT 编写了一个简单的 GUI。接收消息是通过阻塞调用完成的lib说。对于独立刷新的 GUI,通信部分
当我创建以下内容时,我试图创建一个可以被异常终止的线程类(因为我试图让线程等待一个事件): import sys class testThread(threading.Thread): def
我正在用 Haskell 编写服务器,我想在客户端断开连接后显式关闭它们。当我调用 hClose ,线程将阻塞,直到客户端关闭其一侧的句柄。有没有办法让它在不阻塞的情况下关闭? 提前致谢! 最佳答案
这个问题已经有答案了: 已关闭12 年前。 Possible Duplicate: garbage collection Operation 我有几个相关问题。 1.JAVA垃圾收集器运行时,是否占用
我有一个 Angular 函数,它在初始 URL 中查找“列表”参数,如果找到,就会出去获取信息。否则我想获得地理位置。如果存在 URL 参数,我不想获取地理位置。我使用的术语是否正确? constr
我读了很多关于锁定数据库、表和行的文章,但我想要较低的锁定,比如只锁定“操作”,我不知道如何调用它,假设我在 php 中有函数: function update_table() { //que
在我的多线程 mfc 应用程序中,m_view->SetScrollPos 处于阻塞状态并且所有应用程序都被卡住。 View 是在另一个线程中创建的,这是这种行为的原因吗? //SetScrollPo
FreeSwitch 软件在几天内运行良好(~3 - 5 天),然后由于 FreeSwitch 被阻止,新的来电请求被接受!!正在进行的调用继续他们的 session ,他们的调用似乎没有受到影响,但
我有一组按钮,当鼠标悬停在这些按钮上时,它们会改变颜色。这些的 CSS 以这种方式运行: #navsite ul li button { height: 60px; width: 60
由于某些原因,当我调用 WSARecvFrom 时,该函数在接收到某些内容之前不会返回。 _socket = WSASocket(AF_INET, SOCK_DGRAM, IPPROTO_UDP, N
我了解一些关于 Oracle 阻塞的知识——更新如何阻塞其他更新直到事务完成,写入者如何不阻塞读取者等。 我理解悲观和乐观锁定的概念,以及有关丢失更新等典型银行教科书示例。 我也理解 JDBC 事务隔
在两个代码点之间,我是否可以判断进程是否已被内核抢占,或者更确切地说,当时是否有任何其他代码在同一处理器上运行? //Point A some_type capture = some_capture(
这是我在 Oracle 的面试问题。 有一个堆栈,即使堆栈已满,push 操作也应该等到它完成,即使堆栈为空,pop 操作也应该等到它完成。 我们怎样才能做到这一点? 我的回答 让一个线程做push
我想知道是否有人可以告诉我如何有效地使用循环平铺/循环阻塞进行大型密集矩阵乘法。我正在用 1000x1000 矩阵做C = AB。我按照 Wikipedia 上的循环平铺示例进行操作,但使用平铺得到的
我正在阅读有关绿色线程的内容,并且能够理解这些线程是由 VM 或在运行时创建的,而不是由操作系统创建的,但我无法理解以下语句 When a green thread executes a blocki
我正在创建的 JavaScript API 具有以下结构: var engine = new Engine({ engineName: "TestEngine", engineHost
ChildWindow 是一个模态窗口,但它不会阻塞。有没有办法让它阻塞?我基本上想要一个 ShowDialog() 方法,该方法将调用 ChildWindow.Show() 但在用户关闭 Child
我需要一些关于如何调试 10.6 版本下的 Cocoa 并发问题的指导。我正在将“for”循环转换为使用 NSOperations,但大多数时候,代码只是在循环的某个时刻卡住。我可以在控制台中看到 N
我正在使用 ReportViewer 控件和自定义打印作业工作流程,这给我带来了一些问题。我的代码看起来有点像这样: ids.ForEach(delegate(Guid? guid)
我有以下成功复制文件的代码。但是,它有两个问题: progressBar.setValue() 之后的 System.out.println() 不会打印 0 到 100 之间的间隔(仅打印“0”直到
我是一名优秀的程序员,十分优秀!