java - 如何在java中以低内存且更快的方式迁移和处理数据-6ren

java - 如何在java中以低内存且更快的方式迁移和处理数据

转载作者：行者123 更新时间：2023-12-01 15:43:26

27

4

我有一个应用程序，它接收带有 DBF 中的平面表的文件，这些文件会规范化、转换并插入到 MySQL 数据库中，这些文件会增长到 250,000 到 270,000 条记录，现在消耗大约 1.5 - 2 Gb 我必须重复一遍整个过程和各个部分。

我检查进程中是否没有先前的记录，请在HashMaps中帮助我将唯一记录的键保存到其中，以不保存其中的所有信息，这里的问题是要上传文件到数据库DBF总记录数据增长，每次导入内容都会变得更慢并且消耗更多内存，轻松地在一个表中获取 770,000 条记录，并且调用花费更多的 2,000,000

示例:

DBF文件有91个字段，我标准化的数据库给出了5个主表，我必须重复记住DBF的过程5次。

没有什么可以花费我大约 1 小时来迁移包含 250,000 条记录的所有 DBF 文件。

如何才能最大限度地减少时间和 RAM 消耗，除非 RAM 消耗较低并且我在线程“main”java.lang.OutOfMemoryError 中收到几个异常:Java 堆空间

<小时/>

DBF文件结构有很多冗余数据是这样的(列):

调查代码
总体调查数据
在 encuenta 中对数据进行分组
人员详细信息

示例:

| survey_code | survey_columns | group_survey    | more_data | person_details |
|:------------|:---------------|:----------------|:----------|:---------------|
| 1           | ...            | 1               | ...       |1-oscar         |
| 1           | ...            | 1               | ...       |2-juan          |
| 1           | ...            | 2               | ...       |1-catalina      |
| 2           | ...            | 1               | ...       |7-john          |

注意:正如您所看到的，有足够的数据冗余

MySQL数据库的结构是这样的:

Survery (table)
  id
  survey_data

Group_in_survey (table)
  survey_id      
  group_data

Person (table)
  group_id
  person_details

<小时/>

导入过程按照表和依赖关系定义的顺序划分，对于每个表，都会遍历DBF文件中的所有记录。

在我请求启动数据库之前，我将必要的信息加载到 HashMap 中，以便在将记录添加到 MySQL 中的数据库之前执行验证是否存在记录。

此外，每次向 MySQL 数据库添加一条记录时，该记录都会添加到 HashMap，因为其中一个调试过程是重复的。后者在每个进程中完成

最佳答案

据我了解，您首先将记录插入到 HashMap 中以消除重复项，然后将其复制到 MySQL 数据库。如果是这种情况，您可以尝试使用 HugeCollections图书馆及其HugeMap而不是简单的HashMap

关于java - 如何在java中以低内存且更快的方式迁移和处理数据，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/7606558/

27

4

0

文章推荐： java - 测试可选字段值的正确方法

文章推荐： nim-lang - 如何在 Nim 中处理一个 seq 作为返回值

文章推荐： java - SVN检查代码的问题

文章推荐： java - Android Java 中的 Socket 发送和接收

sails.js - 迁移 Sequelize 迁移
我最近开始从事一个 Sails 项目。它目前在迁移表下具有以下格式的迁移。 20160826122004-create_users_table.js 'use strict'; module.expo
symfony - Doctrine :迁移:迁移。元数据存储不是最新的，请运行sync-metadata-storage命令解决这个问题
当我尝试迁移时 doctrine:migrations:migrate ，我收到此异常:“元数据存储不是最新的，请运行 sync-metadata-storage 命令来解决此问题。”。这仅在尝试在生
MarkLogic 迁移
我在 ec2 linux 7 上有一个 MarkLogic 服务器。我想将它迁移到 linux 6。我将 ebs 移动到新的 linux 6 并将其安装在 /var/opt/MarkLogic . 我
OpenID 迁移
我对 OpenID 很好奇。虽然我同意统一凭证的想法很棒，但我有一些保留意见。什么是防止 OpenID 提供商发疯并持有他们拥有的 OpenID 帐户直到您支付 n 美元？如果我决定不喜欢这个提供商，
迁移:在特定列之后添加一列
使用 SQL 很容易做到这一点，但我需要编写一个我不熟悉的 Knex 迁移脚本。以下代码在 order 表中行的末尾添加了 order_id 列。我想在 id 之后添加 order_id。我该怎么做？
迁移:在特定列之后添加一列
使用 SQL 很容易做到这一点，但我需要编写一个我不熟悉的 Knex 迁移脚本。以下代码在 order 表中行的末尾添加了 order_id 列。我想在 id 之后添加 order_id。我该怎么做？
Yii2 迁移 - 在另一列之后添加列
我想通过在 Yii2 中的迁移添加一个新列，使用以下代码: public function up() { $this->addColumn('news', 'priority', $this-
android - SQLDelight 迁移
我正在尝试在 SQLDelight 的表中添加更多列。我做了一个迁移文件 1.sqm .在迁移文件中，它给出了找不到表的错误。我的 build.gradle.kts: sqldelight {
使用单一架构和多个项目进行 Flyway 迁移
我有一个与 Flyway DB 迁移相关的问题。通常如何管理处理相同 DB 模式的多个项目(微服务)。每个项目中的 Flyway 迁移脚本如果被其他项目修改，则不允许启动。他们是否有任何文档或最佳实践
php - 迁移 - 自动创建数据库
我是 Laravel 的新手。我做了一份待办事项申请作为一项学校作业。我们必须使用迁移来创建我们的数据库。我使用迁移创建了 2 个表。我的问题是:如果你第一次在你的电脑上运行这个项目，有没有办法自动
laravel - 迁移:无法添加外键约束
我正在尝试在 Laravel 中创建外键，但是当我使用 artisan 迁移表时，出现以下错误: [Illuminate\Database\QueryException] SQLSTATE[HY000
Django 迁移 - 禁用系统检查
我从 Django 1.7 升级到 Django 1.9。我有多次迁移。升级后我无法再创建新的数据库。问题是“django manage.py migrate”运行检查。检查导入应用程序 URL。这
具有多个数据库的 Django 迁移
我在创建数据迁移方面遇到了困难。我的应用程序使用两个数据库。我在 settings.py 中配置了数据库，并创建了一个像 Django docs 中一样的路由器. # settings.py DB_H
postgresql - 努力与gorm手动创建关系/迁移
我有一个像这样的sql结构: CREATE TABLE resources ( id SERIAL PRIMARY KEY, title TEXT NOT NULL, created_at
Laravel 迁移 - 更新枚举选项
我正在尝试使用模式构建器向表添加枚举选项(不丢失当前数据集)。我真正能够找到的关于列更改的唯一信息是 http://www.flipflops.org/2013/05/25/modify-an-ex
c++ - 迁移 am2cmake
我尝试转移到一些 CMake 程序中，并且有一个从 xml 生成头文件的函数。生成文件.am adaptor_glue.hpp: dbus_introspect.xml $(DBUSXX_X
ios - 迁移 NSPersistentStore
我想将文件移至我的 iOS 应用程序的 CoreData 存储 ../Library/Application Support/MyApp/ 至 ../Documents/Stores/ 我可以使用 N
mysql - NetSuite 迁移
有没有人对数据迁移进出 NetSuite 有丰富的经验？我必须将 DB2 表导出到 MySQL，处理数据，然后导出到一个 CSV 文件中。然后获取帐户的 CSV 文件并再次操作数据以使帐户从我们的旧系
python - Django 迁移
我正在尝试在 Django 上建立一个博客。我已经走到了创建模型的地步。他们在这里: from django.db import models import uuid class Users(mode
html - HTTPS 迁移
我最近使用 bluehost 上的 AutoSSL 工具将网站迁移到 HTTPS。我在内容中看到一些失真，例如缺少背景颜色、表格位移、缺少_logos 等。有谁知道 HTTPS 迁移效果如何影响样式

首页

博学

6Ren·AI

商城

java - 如何在java中以低内存且更快的方式迁移和处理数据