- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在构建一个 Django 应用程序,用户将在其中导入 Excel/CSV 文件。每行都通过一个表格提供,如解释的那样 here (底部的示例 3)。
对于我的导入器,我首先遍历整个文件,然后在表格中显示所有错误。如果没有错误,我会显示将要导入的内容的摘要。然后用户可以确认,文件将被导入。问题是,行相互依赖以进行验证(唯一性约束等),因此我必须将每一行保存到数据库中才能进行验证。
我想出了下面的方法,但我以前没有使用过原子事务,我担心潜在的陷阱。我最多可以导入 10000 行。
下面的代码是否适合我想要实现的目标,或者是否有更好的方法?
def import_from_csv(filename, preview):
sid = transaction.savepoint()
result = import_data(filename)
if result.has_error or preview:
transaction.savepoint_rollback(sid)
else:
transaction.savepoint_commit(sid)
return result
附加信息:
在我的应用程序中有两个不同的 View 。第一个 View 是预览 View 。在这种情况下,我调用 import_from_csv 并将预览设置为 True。这样,插入将始终回滚。它返回本应导入的结果。如果没有错误,我将文件的位置保存在 session 变量中。如果用户点击确认,我再次调用 import_from_csv,但这次预览为 False。由于我在预览步骤已经检查了文件,所以应该不会有任何错误,结果会被提交。我知道这可以优化,因为我处理文件两次。
我正在使用 Django 1.9 和 Postgres(在 Heroku 上)
最佳答案
陷阱 1
无论数据库是什么,插入 10,000 行都不会很快。您可能只能在超时之前将其挤入,但您是在冒险。
陷阱 2
在事务中,一旦发生错误,事务就不能用于进一步的插入,直到你回滚。如果 CSV 中的第二行导致错误,您会发现实际上没有插入任何内容。
根据您更新的信息:
您仍然很难弄清楚哪些记录可以插入,哪些不可以。您可能需要 import_data
中的auto commit
,这会进一步降低速度。
陷阱 3
该方法实际上并没有为用户提供确认或拒绝插入的机会。用户操作将由单独的 HTTP 请求处理。它将不同于发送 CSV 数据的那个。因此,当收到用户操作时,此事务已完成并已清理,无法回滚。
陷阱 4
如果前面的行依赖于后面的行(你说行之间可能有关系)插入将失败。
解决方案
使用数据库批量加载来填充与真实事物相同的临时表除了限制。您尚未指定您的数据库是什么。例如,在 postgresql 中批量加载的方式是 COPY FROM在 mysql 中它是 LOAD DATA .
加载数据后,将约束添加到临时表。与原始表进行连接以确定哪些行是重复的。询问用户是忽略还是更新重复项。然后执行 INSERT SELECT
对提供的额外信息的回应:
如果您使用的是 celery 任务,您可能不依赖于 COPY,但最好将初始导入到临时表中。这样就避免了两次处理数据的需要。而且很容易找出 CSV 文件中的哪些行导致重复。
关于python - 导入文件时在 Django 中使用事务,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36947495/
我正在使用 PostgREST 将数据库实体暴露给使用这些实体的 Springboot 应用。 我的数据库中有两个实体,分别是 Person 和 City。 我想同时保存 Person 实体和 Cit
1、事务的定义 Redis的事务提供了一种“将多个命令打包, 然后一次性、按顺序地执行”的机制。 redis事务的主要作用就是串联多个命令防止别的命令插队。 但是,事务并不具有传统
SQLite 事务(Transaction) 事务(Transaction)是一个对数据库执行工作单元。事务(Transaction)是以逻辑顺序完成的工作单位或序列,可以是由用户手动操作完成,也可
事务是顺序组操作。 它们作为单个单元运行,并且直到组中的所有操作都成功执行时才终止。 组中的单个故障会导致整个事务失败,并导致对数据库没有影响。 事务符合ACID(原子性,一致性,隔离和耐久性)
我希望将 SqlKata 用于一个项目。但是,项目标准的一部分是查询应该能够作为事务执行。有没有一种方法可以使用 MSSQL 事务执行一个查询或多个查询? 非常感谢。 最佳答案 SQLKata 使用
我只是以多线程方式测试 PetaPoco 事务... 我有一个简单的测试用例: -- 简单的值对象称之为 MediaDevice -- 插入一条记录,更新1000次 void TransactionT
我正在尝试从 Excel VBA 向 SQL 中插入一些数据。 SQL 命令是在 VBA 脚本的过程中构建的,包括使用一些 SQL 变量。 我试图了解事务在 VBA 中是如何工作的,以及它们是否可以处
情况如下: 一个大型生产客户端/服务器系统,其中一个中央数据库表具有某个列,该列的默认值是 NULL,但现在默认值是 0。但是在该更改之前创建的所有行当然仍然具有 null 值,这会在该系统中生成许多
数据库事务是一个熟悉的概念。 try { ... .. updateDB() .. ... commit(); } catch error { rollback(); }
我想了解使用传播支持进行 Spring 交易的用途。 java 文档提到如果具有 @Transactional(propagation = Propagation.SUPPORTS) 的方法从支持该事
我需要获取 hibernate 的事务 ID。对于每笔交易,此 ID 必须是唯一的。我尝试使用 session.getTransaction().hashCode(),但我相信这个值不是唯一的。 最佳
我从 firebase 收到以下消息:runTransactionBlock:启用持久性时检测到的使用情况。请注意,事务不会在应用重新启动后保留。 那么应用程序重新启动后到底会发生什么?由于主数据库的
我需要在 jdbc 中执行选择、更新、插入查询的序列。 这是我的代码: public String editRequest(){ connection = DatabaseUtil.getServi
Java 是否提供了一种智能“聚合”事务的方法?如果我有多个异构数据存储库,我想保持同步(即用于数据的 Postgres、用于图表的 Neo4j 以及用于索引的 Lucene),是否有一个范例仅允许
我对标题中的主题有几个问题。首先,假设我们使用 JDBC,并且有 2 个事务 T1 和 T2。在 T1 中,我们在一个特定的行上执行 select 语句。然后我们对该行执行更新。在事务 T2 中,我们
我有一个 Python CGI 处理支付交易。当用户提交表单时,CGI 被调用。提交后,CGI 需要一段时间才能执行信用卡交易。在此期间,用户可能会按下 ESC 或刷新按钮。这样做不会“杀死”CGI,
我有一个代码,类似这样 def many_objects_saving(list_of_objects): for some_object in list_of_objects:
我有一个包含 100,000 条记录的表。我正在考虑使用事务来更新数据。将有一个查询将一列更新为零,并且大约有 5000 个更新,每个更新将更新一条记录。 这些大型事务对内存有何影响?事务运行时选择数
有没有办法在一个命令中执行 SQL 事务?例如 mysql_query(" START TRANSACTION; INSERT INTO table1 ....etc; INSERT INTO tab
真心希望能帮到你! 我使用以下函数在 PHP/MySql 应用程序中发送消息: public function sendMail($sender_id, $recipient_id, $subject
我是一名优秀的程序员,十分优秀!