- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我的 mysql 数据库表中有多达 500k 行数据。我必须使用一些查询来处理这些数据,并将结果查询数据插入到 5 个不同的表中。
我的代码片段如下:
def jobsFunction(values):
unique_values = []
ref_value = {}
for value in values:
if value not in unique_values:
unique_values.append(value[0])
# some select queries with other tables
# from the result insert into table1
for query_vals in select_query:
ref_val[id] = some_val
# Insert into table2 with query_vals
# Update table3 with query_vals
# insert into table4 for each iteration with some process
# insert into table5 based on ref_val[id]
if __name__ == '__main__':
query = "SELECT roll_no, user_id, tenant_item_id FROM table_name"
cursor.execute(query)
vals = cursor.fetchall()
values = list(vals)
jobFunction(values)
问题是完成整个过程需要超过 12 个小时。所以我决定使用 multiprocessing.Pool
完成该过程,代码如下:
import multiprocessing as mp
def jobsFunction(values):
# jobs function code
if __name__ == '__main__':
# values fetching
lock = mp.Lock()
p = mp.Pool()
p.map(jobsFunction, values)
p.close()
p.join()
但在这种情况下,从 main 函数到 jobsFunction
的数据流不按顺序排列。
我的问题是:我使用的方法是否满足我的要求?如何使用多处理或多线程有效地实现我的要求?
最佳答案
从数据库中取出数据然后写入回来的速度很慢。尽量避免它。一些数字:如果每个查询只需要 100 毫秒,那么执行它们就需要超过 13 个小时。
考虑使用这种设计:不要将所有数据传输到 Python 进行处理,而是使用一系列或 SQL 查询来完成数据库内的所有操作。因此,不要将数据读入 Python 列表,而是使用 SQL 查询,例如
insert into table1 (...)
select ... from table_name
或
update table1 out
set out.col1 = source.col2,
out.col2 = source.col3 ...
from table_name source
where out.pk = source.pk
and ...
数据库经过优化以复制数据。这些查询将运行得非常快,特别是当您正确设置索引时。
考虑使用辅助表来使您的查询更加简单或高效,因为您可以创建它们、截断它们、用数据填充它们,然后为您的案例创建完美的索引。
仅在 Python 中执行真正复杂的操作,并确保它只处理几行。
关于python - 如何使用多处理有效地将数据从一个数据库表插入到另一个数据库表?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55255054/
我的问题是如何在 python 中创建一个简单的数据库。我的例子是: User = { 'Name' : {'Firstname', 'Lastname'}, 'Address' : {'Street
我需要创建一个与远程数据库链接的应用程序! mysql 是最好的解决方案吗? Sqlite 是唯一的本地解决方案吗? 我使用下面的方法,我想知道它是否是最好的方法! NSString *evento
给定两台 MySQL 服务器,一台本地,一台远程。两者都有一个包含表 bohica 的数据库 foobar。本地服务器定义了用户 'myadmin'@'%' 和 'myadmin'@'localhos
我有以下灵活的搜索查询 Select {vt:code},{vt:productcode},{vw:code},{vw:productcode} from {abcd AS vt JOIN wxyz
好吧,我的电脑开始运行有点缓慢,所以我重置了 Windows,保留了我的文件。因为我的大脑还没有打开,所以我忘记事先备份我的 MySQL 数据库。我仍然拥有所有原始文件,因此我实际上仍然拥有数据库,但
如何将我的 Access 数据库 (.accdb) 转换为 SQLite 数据库 (.sqlite)? 请,任何帮助将不胜感激。 最佳答案 1)如果要转换 db 的结构,则应使用任何 DB 建模工具:
系统检查发现了一些问题: 警告:?:(mysql.W002)未为数据库连接“默认”设置 MySQL 严格模式 提示:MySQL 的严格模式通过将警告升级为错误来修复 MySQL 中的许多数据完整性问题
系统检查发现了一些问题: 警告:?:(mysql.W002)未为数据库连接“默认”设置 MySQL 严格模式 提示:MySQL 的严格模式通过将警告升级为错误来修复 MySQL 中的许多数据完整性问题
我想在相同的 phonegap 应用程序中使用 android 数据库。 更多说明: 我创建了 phonegap 应用程序,但 phonegap 应用程序不支持服务,所以我们已经在 java 中为 a
Time Tracker function clock() { var mytime = new Date(); var seconds
我需要在现有项目上实现一些事件的显示。我无法更改数据库结构。 在我的 Controller 中,我(从 ajax 请求)传递了一个时间戳,并且我需要显示之前的 8 个事件。因此,如果时间戳是(转换后)
我有一个可以收集和显示各种测量值的产品(不会详细介绍)。正如人们所期望的那样,显示部分是一个数据库+建立在其之上的网站(使用 Symfony)。 但是,我们可能还会创建一个 API 来向第三方公开数据
我们将 SQL Server 从 Azure VM 迁移到 Azure SQL 数据库。 Azure VM 为 DS2_V2、2 核、7GB RAM、最大 6400 IOPS Azure SQL 数据
我正在开发一个使用 MongoDB 数据库的程序,但我想问在通过 Java 执行 SQL 时是否可以使用内部数据库进行测试,例如 H2? 最佳答案 你可以尝试使用Testcontainers Test
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 已关闭 9 年前。 此问题似乎与 a specific programming problem, a sof
我正在尝试使用 MSI 身份验证(无需用户名和密码)从 Azure 机器学习服务连接 Azure SQL 数据库。 我正在尝试在 Azure 机器学习服务上建立机器学习模型,目的是我需要数据,这就是我
我在我的 MySQL 数据库中使用这个查询来查找 my_column 不为空的所有行: SELECT * FROM my_table WHERE my_column != ""; 不幸的是,许多行在
我有那个基地:http://sqlfiddle.com/#!2/e5a24/2这是 WordPress 默认模式的简写。我已经删除了该示例不需要的字段。 如您所见,我的结果是“类别 1”的两倍。我喜欢
我有一张这样的 table : mysql> select * from users; +--------+----------+------------+-----------+ | userid
我有表: CREATE TABLE IF NOT EXISTS `category` ( `id` int(11) NOT NULL, `name` varchar(255) NOT NULL
我是一名优秀的程序员,十分优秀!