c++ - 在 C/C++ 中遍历 Fasta 文件-6ren

c++ - 在 C/C++ 中遍历 Fasta 文件

转载作者：行者123 更新时间：2023-11-30 17:23:51

我正在寻找用 C/C++ 编写一个程序来遍历格式如下的 Fasta 文件:

>ID and header information
SEQUENCE1
>ID and header information
SEQUENCE2

等等

为了找到所有唯一的序列(检查是否是任何其他序列的子集)并将唯一序列(和所有 header )写入输出文件。

我的方法是:

但是，我有点不确定如何正确阅读这些行。我需要阅读标题的顶行，然后“返回？”到下一行来读取序列。有时序列跨越两行以上，那么我会使用 > (来自上面的示例)作为分隔符吗？如果我使用 C++，我想我会使用 iostreams 来完成此任务？

如果有人能够在正确的方向上插入我如何阅读我需要操纵的信息/如何进行比较，我将不胜感激。

最佳答案

首先，您可能想使用已经存在的东西，而不是编写自己的 FASTA 阅读例程，例如，请参阅:http://lh3lh3.users.sourceforge.net/parsefastq.shtml

在内部，您将获得不带换行符的序列，这可能会有所帮助。我认为从高层次来看最简单的方法是

关于c++ - 在 C/C++ 中遍历 Fasta 文件，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/27375111/

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章