gpt4 book ai didi

c++ - 使用 C++ 字符串类函数从更长的原始基因组字符串中显示 “gene substrings”

转载 作者:太空宇宙 更新时间:2023-11-04 11:44:18 24 4
gpt4 key购买 nike

请帮忙。我正在使用序列 TGTGTGTATAT 测试我的基因查找器程序,其中起始帽 ATG 添加到前端,结束帽 TAA 添加到末尾所以我正在测试基因组 ATGTGTGTTATATTAA 因为不包括大写序列不是 3 个字符的倍数因此在长度上它不包含任何基因,应该显示

“没有找到基因”

黑色cout窗口确实弹出但它什么也没显示

//Date: 
//purpose: find Genes and cout found genes

#include <iostream>
#include <string>
#include <cctype>
#include <cmath>
#include <algorithm>
using namespace std;
int main()
{
string genome = "ATGTGTGTGTATATTAA"; //testing this string
/*cout << "Enter a genome string: ";
cin >> genome;*/

int geneCounter = 0;


while(!genome.empty()) //enters loop if strings not empty
{


if(genome.find("ATG",0) == string::npos) //genome.find("ATG",0,3) should return npos if no ATG is found right?
{
if(geneCounter == 0)
{
cout << "no gene is found";
genome.clear();
}
}
else
{
int startGene = genome.find("ATG",0); //ATG is not part of gene just a front endcap to genes
int endGene = min(min(genome.find("TAG"), genome.find("TAA")), genome.find("TGA"));//endcaps are TAG or TAA or TGA
//finds location of (1+ gene end)


string currentGene = genome.substr(startGene + 3, endGene - (startGene +3)); //puts copy of gene in substring

if((currentGene.length() % 3) == 0)
{
geneCounter += 1;
cout << currentGene <<endl;//a gene is a multiple of three characters so if its a gene I cout the gene
}

endGene += 3;
genome.erase(0, endGene); //should erase the gene I just "cout"displayed
//and its front ATG and its endcap and anything before its ATG

//cout << genome; //testing: this should display the genome after the endcap of the last gene cause I erased all coming before
}
}



return 0;
}

最佳答案

这听起来像是干净的正则表达式解决方案的完美用例。再次验证基因串的具体规则是什么?

以ATG开头

三个字符的基因。允许使用哪些字符?

以TTA结尾

使用像这样的正则表达式

^ATG([A-Z]{3})+TTA$

^ 是一行的开始。 ATG 是精确匹配的字符串。 ([A-Z]{3})+ 是一个匹配组,表示将在找到时提取,具有 A-Z 中的三个字符。 TTA 又是一个精确匹配。加号仅在至少找到该组中的一个时才有效。$ 是该行的末尾。

如果只有 [A-Z] 是有效字符,您可以使用 [ATGE] 而不是 [A-Z]。

这应该可以完全解决您的问题。为所有内部三个 char 子字符串提供一个迭代器,同时检查长度开始和结束。

http://www.cplusplus.com/reference/regex/

关于c++ - 使用 C++ 字符串类函数从更长的原始基因组字符串中显示 “gene substrings”,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20254293/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com