作者热门文章
- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
<分区>
我是一名生物信息学工程师,经常使用 UNIPROT 数据库。它在一个巨大的文件中包含大约 600 万个条目。
现在我使用一种方法,我为一些 ID 条目创建了一个“索引”文件,当我想访问一个蛋白质时,我从索引文件中 grep 条目,然后使用该索引搜索巨大的数据库文件.搜索给定的蛋白质大约需要 0.3 秒。
我正在寻找一种更快的方法,并找到了 SQL 表。我对它们一无所知,所以如果有问题,我会问几个。
我可以用 SQL 表更快地实现相同的目的吗?如果是,您会建议我使用哪种数据结构?有什么好网站可以让我获得有关它的好教程吗?我也在 python 中工作,所以我对 SQL 在 python 中的集成很感兴趣。据我所知,python 中有一些可导入的 SQL 模块。我错了吗?我可以只在 python 中执行此操作,还是必须使用“开箱即用”的方法?
TLDR:我能否实现一个包含大约 600 万个条目的 ID --> 蛋白质(可能是一些附加信息)表,我可以在其中使用 python 中的 SQL 在大约 0.01 秒内搜索特定 ID?
我是一名优秀的程序员,十分优秀!