gpt4 book ai didi

compression - 生物信息学压缩核苷酸序列

转载 作者:行者123 更新时间:2023-12-05 05:53:59 35 4
gpt4 key购买 nike

对于压缩由 fasta 核苷酸序列组成的数据集,推荐的压缩算法是什么(.xz、tar.gz、tar.bz2 等)?

此类数据的推荐压缩机制是什么?

  1. 基于字典的压缩
  2. 基于自适应字典的压缩
  3. 基于LZW算法的压缩

最佳答案

我看到 gzip 使用得最多,所以我推荐 gzip,正如评论中提到的 CJR。这是与协作者最兼容的选项,即使不是最有效的(取决于您对效率的定义)。

在某些情况下,协作者和您可以安装专门的压缩工具,可能值得研究更高效的工具,例如,请参阅这篇论文,其中使用几种不同的指标(尤其是图 1)对其中许多工具进行了比较:

Kirill Kryukov、Mahoko Takahashi Ueda、So Nakagawa、Tadashi Imanishi,序列压缩基准 (SCB) 数据库——针对 FASTA 格式序列的无引用压缩器的全面评估,GigaScience,第 9 卷,第 7 期,7 月2020, giaa072, https://doi.org/10.1093/gigascience/giaa072 : https://academic.oup.com/gigascience/article/9/7/giaa072/5867695

关于compression - 生物信息学压缩核苷酸序列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/69776890/

35 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com