gpt4 book ai didi

database-design - 快速查找 100GB 数据

转载 作者:行者123 更新时间:2023-12-04 07:14:40 25 4
gpt4 key购买 nike

我有大约 100GB 的数据保存在 ~10MB .csv 文件中。如何优化对该数据的数千个查询的查找速度?具体来说,我不知道要考虑哪些技术或如何估计相对性能。

每个文件对于一个日期都是唯一的,并且包含多个人的数据,例如:

...
2005-07-03, "Daffy Duck", ...
2005-07-03, "Daffy Duck", ...
2005-07-03, "Mickey Mouse", ...
2005-07-03, "Mickey Mouse", ...
...

我想为数千个日期/名称对提取与给定日期/名称对应的所有信息。等效的 SQL 查询将是 SELECT * FROM myDB WHERE Date='2005-07-03' AND Name='Mickey Mouse' .

目前我还没有将数据加载到数据库中。为了执行我的“查询”,我找到了适当的日期文件并按我要查找的名称过滤行。将数据存储在关系数据库、noSQL 数据库或任何其他方式中,我会获得性能改进吗?如果是,为什么和多少?

最佳答案

Would I get performance improvements storing the data in a relational database, noSQL database, or in any other way?



是的(我建议使用“正常”的 RDBMS)

If so why…



这是索引的用途之一

…and by how much?



很多

关于database-design - 快速查找 100GB 数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13612821/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com