java - 基因组处理服务器 - 方法返回 0，我不明白为什么(java)-6ren

java - 基因组处理服务器 - 方法返回 0，我不明白为什么(java)

转载作者：太空宇宙更新时间：2023-11-04 09:15:00

对于我的作业，我必须计算基因组与序列相比的最佳相似性得分。要确定相似性得分，您必须将序列的长度减去汉明距离，然后再除以序列的长度。汉明距离是指基因组子串中有多少部分不等于序列。例如，GTTC 和 AGGT 的汉明距离为 4，因为它们在任何点都不相等。

如果您为该方法提供基因组=“ATACGC”和序列=“ACT”，则最佳相似性得分应为 0.67。但是当我运行我的程序时，它只会返回 0。我正在使用 Android 应用程序与我的基因组处理服务器交互。谢谢你，如果你能帮我解决这个问题!!!

返回 0 的方法的代码-

public static String similarityScore(String genome, String sequence)
{
    double bestSimilarity;
    double similarity;
    int i;
    int j;
    int hammingDistance;
    String subString;
    String miniSubString;
    String subSequence;
    String returnStr;
    DecimalFormat df;

    df=new DecimalFormat("#.##");
    bestSimilarity=-1;
    i=0;
    //makes a substring of the genome so you can compare the substring to the sequence
    //increments i by 1 each iteration to move down the string to make new substrings
    while((i+sequence.length())<(genome.length()+1) && i<genome.length())
    {
        subString = genome.substring(i, i + sequence.length());

        hammingDistance=0;
        for (j=0;j<sequence.length();j++)
        {
            // these two lines make substrings of a single character
            //to compare if they equal each other
            miniSubString = subString.substring(j, j + 1);
            subSequence = sequence.substring(j,j+1);
            //if they dont equal each other increase hamming distance by 1
            if(!miniSubString.equals(subSequence))
                hammingDistance++;
        }
        //calculates hammingdistance, which is the
        // (length of the sequence - the hamming distance) / the length of the sequence
        similarity=(sequence.length()-hammingDistance)/sequence.length();
        if (similarity>bestSimilarity)
            bestSimilarity=similarity;

        i++;
    }
    returnStr=df.format(bestSimilarity);
    return returnStr;
}

最佳答案

我认为这是因为你的答案被转换为整数。以下是我得出正确答案的方法。

添加此:

Double len = sequence.length() * 1.0;

将其添加到以下行之前:

similarity=(sequence.length()-hammingDistance)/sequence.length();

然后将该行替换为:

similarity=(sequence.length()-hammingDistance)/len;

这应该会给你你正在寻找的答案。

编辑:修复了一行。

关于java - 基因组处理服务器 - 方法返回 0，我不明白为什么(java)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59145790/

文章推荐： java - 如何使用 XAdES4j 签署 xml 并引用 URI (#DatosEmision)？

文章推荐： python - python中列表的索引

python - SQL(ite)快速检索较大字符串(基因组)的多个子字符串
我有一个 sql 数据库，其中包含基因组、染色体和“有趣”区域(BED 格式)。基因组(例如 4GB)由 +/- 20 条染色体组成，因此每个字符串大约有 200MB 大。例如，基因组中的染色体由字符

太空宇宙

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

java - 基因组处理服务器 - 方法返回 0，我不明白为什么(java)