database - MPI如何发送和接收SQLite数据库-6ren

database - MPI如何发送和接收SQLite数据库

转载作者：搜寻专家更新时间：2023-10-30 23:40:05

24

4

我有一个很大的SQLite数据库要处理，所以我想使用MPI进行并行化以加快速度。我想要做的是将一个数据库从 root 发送到每个 slave，并在 slave 添加一些表后将修改后的数据库发送到 root。我想用MPI_Type_create_struct 创建一个数据类型来存储数据库，但是数据库太复杂了。还有其他方法可以处理这种情况吗？先感谢您!

最佳答案

我最近处理了一个类似的问题 - 我有一个使用 SQLite 作为配置存储的大型 MPI 应用程序。使用嵌入式 SQL 数据库处理多进程写入是一项挑战。我的经验涉及使用共享文件系统的大规模并行应用程序(运行多达 65,535 个队列)。

基于FAQ根据 SQLite 和一些数据库引擎的经验，有几种方法可以解决这个问题。我假设您正在使用共享的分布式文件系统和多台独立的计算机(标准 HPC 集群设置)进行操作。

由于 SQLite 在多个进程写入数据库(但不读取)时会阻塞，因此读取很可能不是问题。每个进程都可以同时运行多个 SELECT 命令而不会出现问题。

挑战在于写作。磁盘 I/O 比计算慢几个数量级，所以通常这将是瓶颈。话虽如此，网络通信也可能会显着变慢，因此您如何处理这个问题实际上取决于您的运行环境中最薄弱的环节在哪里。

如果您的网络速度很快但磁盘速度很慢，或者如果您想以最直接的方式实现这一点，最好的办法是让一个单个 MPI rank 负责写入数据库。您的计算进程将独立运行 SELECT 命令，直到计算完成，然后将新数据发送到 MPI 数据库进程。然后数据库控制进程将新数据写入磁盘。我不会尝试通过网络发送数据库的结构，而是发送应该写入的数据，以及(可能)标识应该写入数据的表/插入查询的标志。这种技术有点类似于 RDBMS 的工作方式 - 虽然 RDBMS 服务器确实支持并发写入，但有一个“中央”进程控制写入操作的顺序。

需要注意的一件事是，如果一个进程写入 SQLite 数据库，文件将被锁定，所有试图读取或写入它的进程。您将需要在您的工作进程中处理 SQLITE_BUSY 返回码，注册一个回调来处理这个，改变繁忙的行为，或者使用替代技术。在我的应用程序中，我发现将数据库加载为内存数据库 ( https://www.sqlite.org/inmemorydb.html ) 为读者提供了一个很好的解决方法。读者访问内存数据库，但将结果发送到控制进程进行写入。缺点是您将在内存中拥有多个数据库副本。

另一个网络密集度较低的选项是并发读取并让每个工作进程写出到他们自己的文件中。您可以写出单独的 SQLite 数据库文件，甚至可以导出 CSV 之类的文件(取决于数据的复杂性)。写入完成后，您将使用一个进程将各个文件合并到一个结果数据库文件中 - 请参阅 How can I merge many SQLite databases? .此方法有其自身的问题，但根据您的瓶颈所在以及整个系统的布局方式，此技术可能会奏效。

最后，您可以考虑从 SQLite 数据库中读取数据并将数据保存为适当的分布式文件格式，例如 HDF5(或使用 MPI IO)。计算完成后，编写脚本从这种外部文件格式创建新的 SQLite 数据库将非常简单。

关于database - MPI如何发送和接收SQLite数据库，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/36063757/

24

4

0

文章推荐： database - db2 "export to filename.csv"给出 IO 错误

文章推荐： python - 合并地址还是不合并地址？

MPI 接收/收集动态矢量长度
我有一个存储结构向量的应用程序。这些结构保存有关系统上每个 GPU 的信息，如内存和 giga-flop/s。每个系统上有不同数量的 GPU。我有一个程序可以同时在多台机器上运行，我需要收集这些数据
MPI 非阻塞发送/接收
我很好奇 MPI 中缺少此功能: MPI_Isendrecv( ... ); 即，非阻塞发送和接收，谁能告诉我其省略背后的基本原理？最佳答案我的看法是 MPI_SENDRECV存在是为了方便那些想
c - 接收/接收的最大镜头数是多少
当我用以下方法监听TCP或UDP套接字时 ssize_t recv(int sockfd, void *buf, size_t len, int flags); 或者 ssize_t recvfrom
java - 如何推迟事件触发/接收
SUM:如何在 azure 事件网格中推迟事件触发或事件接收？我设计的系统需要对低频对象状态(创建、启动、检查长时间启动状态、结束)使用react。它看起来像是事件处理的候选者。我想用azure函数
来自未知来源的 MPI 接收
我正在 MPI 中实现一个程序，其中主进程(等级 = 0)应该能够接收来自其他进程的请求，这些进程要求只有根才知道的变量值。如果我按等级 0 进行 MPI_Recv(...)，我必须指定向根发送请求的
c++ - WM_CLOSE事件从不发送/接收？
我正在学习DX12，并在此过程中学习“旧版Win32”。我在退出主循环时遇到问题，这似乎与我没有收到WM_CLOSE消息有关。在C++，Windows 10控制台应用程序中。 #include
java - 如何推迟事件触发/接收
SUM:如何在 azure 事件网格中推迟事件触发或事件接收？我设计的系统需要对低频对象状态(创建、启动、检查长时间启动状态、结束)使用react。它看起来像是事件处理的候选者。我想用azure函数
java - 我如何处理短信发送/接收？
我想编写方法来通过号码发送短信并使用编辑文本字段中的文本。发送消息后，我想收到一些声音或其他东西来提醒我收到短信。我怎样才能做到这一点？先感谢您，狼。最佳答案这个网站似乎对两者都有很好的描述:ht
java - 接收/发送数据报套接字数据
所以我正在用 Java 编写一个程序，在 DatagramSocket 和 DatagramPacket 的帮助下发送和接收数据。问题是，在我发送数据/接收数据之间的某个时间 - 我发送数据的程序中的
java - 构建相机应用程序 - 接收
我是 Android 编程新手，我正在用 Java 编写一个应用程序，该应用程序可以打开相机拍照并保存。我通过 Intents 做到了，但看不到 onActivityResult 正在运行。我已经在
c++ - 一个套接字在线程中发送/接收
我有一个套接字服务器和一个套接字客户端。客户端只有一个套接字。我必须使用线程在客户端发送/接收数据。 static int sock = -1; static std::mutex mutex; vo
c - 数据未正确发送/接收
我正在尝试使用 c 中的套接字实现 TCP 服务器/客户端。我以这样的方式编写程序，即我们在客户端发送的任何内容都逐行显示在服务器中，直到键入退出。该程序可以运行，但数据最后一起显示在服务器中。有人可
c - 接收 AT 命令
我正在使用微 Controller 与 SIM808 模块通信，我想发送和接收 AT 命令。现在的问题是，对于某些命令，我只收到了我应该收到的答案的一部分，但对于其他一些命令，我收到了我应该
c - 接收 SIGTERM
我用c设计了一个消息传递接口(interface)，用于在我的系统中运行的不同进程之间提供通信。该接口(interface)为此目的创建 10-12 个线程，并使用 TCP 套接字提供通信。它工作正
c - 在套接字中发送多个发送/接收
我需要澄清一下在套接字程序中使用多个发送/接收。我的客户端程序如下所示(使用 TCP SOCK_STREAM)。 send(sockfd,"Messgfromlient",15,0);
c++ - 多线程多套接字同时发送/接收
我正在构建一个真正的基本代理服务器到我现有的HTTP服务器中。将传入连接添加到队列中，并将信号发送到另一个等待线程队列中的一个线程。此线程从队列中获取传入连接并对其进行处理。问题是代理程序真的很慢。
json - 接收 JSON 帖子
我正在使用 $routeProvider 设置一条类似的路线 when('/grab/:param1/:param2', { controller: 'someController',
nginx - 接收 HLS 流并重播
我在欧洲有通过 HLS 流式传输的商业流媒体服务器。http://europe.server/stream1/index.m3u8现在我在美国的客户由于距离而遇到一些网络问题。所以我在美国部署了新服
django - 接收 celery 任务中的事件
我有一个长期运行的 celery 任务，该任务遍历一系列项目并执行一些操作。任务应该以某种方式报告当前正在处理的项目，以便最终用户知道任务的进度。目前，我的django应用程序和celery一起坐
Odoo Controller 接收 blob
我需要将音频文件从浏览器发送到 python Controller 。我是这样做的: var xmlHttp = new XMLHttpRequest(); xmlHttp.open( "POST",

首页

博学

6Ren·AI

商城

database - MPI如何发送和接收SQLite数据库