- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个 *.csv 格式的约 10 GB 的大文件。这是1960年至今不同地区的数据。我能够按区域分解文件。大约有 8000 个区域,我按区域分割文件,因此我有 8000 个文件,每个文件大约 2 MB。
我想知道创建 Access 数据库系统来查找每个区域的数据的最有效方法是什么。是由:
按区域名称将文件分成小文件(即每个区域8000个文件),然后导入它们每次 Access ,或者
将它们分割成每个约 1 GB 的恒定大小并进行查询。
无论哪种情况,如何将文件导入 Access?
最佳答案
您可能知道,Access 数据库文件的大小限制为 2GB,因此您几乎肯定无法将所有信息保存在一个文件中。即使它勉强适合,将这么多信息保存在一个 Access 数据库文件中也可能会导致处理速度相当慢。
根据您数据的“形状”,Access 中可能存在其他限制,这些限制可能会在您的特定情况下造成困难。例如,表(或查询)仅限于 255 列。如果您还没有这样做,请查看 Access specifications在进一步进行此操作之前。
无论如何,请考虑使用另一个数据库作为后端。您的数据甚至对于 SQL Server Express Edition 中的单个数据库来说可能太大(我记得每个数据库的总大小最大为 10GB),但即使您必须将数据拆分为两个 SQL Express 数据库,处理起来也会更容易十多个(或更多?)Access 数据库。
请记住,如果您使用不同的数据库后端,您仍然可以使用 Access 作为查询和报告工具(通过 ODBC 链接表)。
根据您的描述,您是否永远需要跨区域查询(请记住,“从不”是非常很长一段时间™) 那么你的 8000 个文件的方法是可行的。但是,我不一定建议您每次运行查询时都导入相应的 CSV 数据。相反,我会借鉴 Tom 和 HansUp 的答案:
计划“A”:首先直接针对 CSV 文件本身运行查询,看看速度是否足以满足您的需求。您可以通过创建 linked table 来测试这一点到 CSV 文件并运行一些典型的查询。正如 Tom 提到的,CSV 链接表无法建立索引,因此如果您发现查询太慢,那么您可能必须采用“B”计划。
计划“B”:如果您确实需要导入 CSV 数据,那么您可能需要使用 HansUp 的建议,即使用 DoCmd.TransferText
来帮助自动化过程。为每个查询导入特定的 CSV 文件似乎很浪费,因此您可能会考虑创建约 8000 个 .accdb
文件,然后使用如下查询...
strSQL = _
"SELECT * FROM TableName " & _
"IN ""C:\__tmp\region12345.accdb"" " & _
"WHERE StartDate BETWEEN #2013-05-10# AND #2013-05-15#"
...您的代码可以替代的地方
基于感兴趣区域的相应 .accdb
文件的名称,以及
所需的日期范围。
关于vba - 微软 Access : Import CSV file from a list of multiple files,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16776241/
我刚刚通过更改 import * as CodeMirror 修复了一个错误简单明了import CodeMirror . 我复制了this code . (从 TypeScript 移植) impo
我调试(在 PyCharm 中)一个脚本。我在断点处停止,然后转到调试控制台窗口,然后从那里调用导入行,如下所示: import my_util1 from my_utils 然后我调用 my_uti
谁能给我解释一下 import 语句是如何工作的? 例如,我在 myapp/app/models 包中有一个类型 User: package models type User struct {
我想导入 Control.App进入一个引用 PrimIO.PrimIO 的模块通过不合格的名称 PrimIO在很多地方。当然,问题在于 Control.App还导出一个名为 PrimIO 的定义.我
我应该使用 from foo import bar 或者 import foo.bar as bar 当导入模块 还有无需/希望更改名称 (bar)? 有什么不同吗?有关系吗? 最佳答案 假设 bar
我正在 Windows 上使用 Theano 进行深度学习实验的第一步,我很惊讶仅仅加载库需要多少时间。 这是小测试程序: from time import time t0 = time() impo
在 TypeScript 中,如何在不创建任何别名的情况下从文件“导入 *”? 例如我有一个包含顶级导出函数的文件“utils”,我想导入所有这些函数而不为每个函数重新创建别名。 像这样: impor
我应该使用 from foo import bar 或 import foo.bar as bar 当导入模块并且不需要/希望更改名称(bar)? 有什么不同吗?有关系吗? 最佳答案 假设bar是fo
这个问题在这里已经有了答案: Use 'import module' or 'from module import'? (23 个回答) 关闭8年前。 我想知道代码片段之间是否有任何区别 from u
我试过了 from urllib import request mine = request.Request() 和 import urllib.request mine = urllib.reque
所以,我有一个关于 Python 导入的小谜团。我确信出于某种原因事情应该是这样的,因为 Guido 很少出错。但是,为什么会这样呢? $ cat myModule.py #!/usr/bin/pyt
我们正在将 Rails 3.2 应用程序升级到 Rails 4.0。 我们有一个 assets/stylesheets/application/index.css.sass加载一些其他 sass 文件
我正在开发一个相当小的 Typescript 代码库,该代码库已经足够大,可以拆分到多个文件中。这是一个二十一点游戏。我目前有一堆代码,看起来像: var player = new Player();
是否可以以当模块为 use 时的方式编写模块? d 没有显式导入所有子例程都被导入,当它是 use d 显式导入只有这些显式导入的子程序可用? #!/usr/bin/env perl6 use v6;
这个问题在这里已经有了答案: how to watch changes in whole directory/folder containing many sass files (9 个回答) 5年前
我真的很难让它在 xcode 4 中工作。 我有一个项目将在许多应用程序(网络)中重用,因此我创建一个工作区并添加我的两个项目。到目前为止,一切都很好....这就是失败的地方.. #import "J
经典提取器和新提取器之间的主要区别是什么,哪个最好用? 最佳答案 经典提取器使用原始工作流程,与爬虫和连接器相同。 新的提取器更加精简,通常看起来和感觉都更好,并且经典提取器中的许多小错误已在新提取器
在处理 google webfont import mixin 时,我注意到无法动态构建 @import URL。 .gFontImport (@name, @weights, @subsets) {
我正在关注Django 1.8 tutorial 。在我的项目中mysite ,有一个源文件夹polls 。文件夹中有views.py模块其中 index函数已定义。还有一个urls.py文件: fr
我想使用名为 warp 的第三方库编译一个简单的 Rust 程序: [package] name = "hello-world-warp" version = "0.1.0" [dependencie
我是一名优秀的程序员,十分优秀!