- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
几周来我一直在尝试不让这个程序运行。我是编程新手,这绝对是一个挑战。我认为我的问题出在我的 if 语句上。我可以让它将名称附加到新文件,但它只是将整个序列附加到文件而不是计算它。我正在处理一个包含多个序列的 fasta 文件,名称以“>”开头,序列在其下方一行。这是我的代码。请帮助,并在此先感谢您!!
#! /bin/bash
#exit program with error if user does not specify input on command line
if [ $# != 1 ]; then
echo "Please specify fasta input on command line and rerun"
exit
else echo "Beginning count"
fi
#collect input from user each time they run the program
input=`cat $1`
#seperate the sequence from the sequence name
name=`grep '>' $1`
sequence=`grep -v '>' $1`
#if name, if sequence
IFS=$'\n'
set -f
for i in $(cat "$1");
do
if [ $i=">" ]; then
echo "$i" >> GCcontent.txt
else
#count number of occurence of motif ATGC in fasta sequence
countG=`echo $i | grep -o "G" | wc -l`
countC=`echo $i | grep -o "C" | wc -l`
total=`echo $i | wc -m`
count=`echo "scale=2" ; ($countG+$countC) | bc`
#calculate percent over total divided by 3bp
percent=`echo "scale=2 ; ($count/$total*100)" | bc`
#print output name and percent to file
echo "$percent" >> GCcontent.txt
fi
done
echo "Exiting"
exit
编辑:输入文件:(> 周围没有引号,没有它们我不会把它放在那里)'>'gi|226451773|gb|FJ846591.1CATTATAGACTGCGTGGTCCGTATTCCCAAGGAGCAGGGAGTTCTGTCCTTCTGGCGCGGTAACCTGGCCAATGTCATCAGATACTTCCCCACCCAGGCTCTTAACTTCGCCTTCAAAGATAAATACAAGCAGATCTTCCTAGGTGGTGTGGACAAGAGGACCCAGTTTTGGCGCTACTTTGCAGGGAATCTGGCATCAGGTGGTGCCGCAGGGGCCACATCCCTGTGTTTTGTGTACCCTCTTGATTTTGCCCGTACCCGTCTAGCAGCTGATGTGGGTAAAGCTGGAGCTGAAAGGGAATTCCGAGGCCTCGGTGACTGCCTGGTTAAGATCTACAAATCTGATGGGATTAAGGGCCTGTACCAAGGCTTTAACGTGTCTGTGCAGGGTATTATCATCTACCGAGCCGCCTACTTCGGTATCTATGACACTGCAAAGGGTAAGTTTGCTGTGGGCTTTAAAGTTGTGTTCTTAGGAGACAATTTAAAAGAGCGTTGTACCAACCTAACATTCCAAGAGCTAGAGAGTTTTTTTAATTGCTGAAGGAAGCCAAGATCATCCAGTGCGACCCTCATGCACAGATGACATGTTTAGGGGATGTGGGGAAAGGAAGTCAGTAAAACTCTACTTTTTGGTAAAAGCATCTCTTTCCTATTCCCAGGAATGCTTCCGGATCCCAAAAACACTCACATCGTCATCAGCTGGATGATCGCACAGACTGTCACTGCTGTTGCTGGGTTGACTTCCTATCCATTTGA (但文件中有多个)
我希望输出文件具有:'>'gi|226451773|gb|FJ846591.1'Percent 会去这里'
最佳答案
awk
助您一臂之力!
在这里使用您的输入文件(行)是一个概念证明
$ awk '{s=length($2);
g=gsub("G","",$2); c=gsub("C","",$2); t=gsub("T","",$2); a=gsub("A","",$2);
total=a+c+g+t;
print a,c,g,t,total,100*(c+g)/total,total==s}' file
185 175 190 209 759 48.0896 1
最后一个值 1
检查单个匹配项的总匹配项和。
您想将逻辑应用于以 >>
符号为前缀的行
$ awk '/^>/{...; print $1, 100*(c+g)/total}' inputfile > outputfile
从上面复制相关部分以填补空白。
如果你有没有任何匹配的行,总计将为零并且除法将失败。你可以加一个守卫。
完整的脚本可以这样
$ awk '/^>/{g=gsub("G","",$2); c=gsub("C","",$2); total=length($2);
print $1, (total?100*(c+g)/total:"no match found")}' inputfile > outputfile
关于linux - 无法让我的程序运行 - %GC 计算器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35947690/
在我们对延迟敏感的应用程序中,我们有缓存数据(驻留在 TG 中)和在 YG 中消亡的短暂对象。我已经看到次要 GC 时间和主要 GC 时间有显着差异。我怀疑这与TG的尺寸相对较大有关。谁能解释 GC
我看到了多个建议运行 GC.Collect(GC.MaxGeneration) 的答案。 既然方法GC.Collect()会收集所有存在的分代,那么两者有什么区别吗? 也许如果只有两代而不是三代,GC
我们正在使用 UseParallelGC。 GC 日志看起来像 2016-06-09T19:38:17.362+0000:655312.397:[完整GC(人体工程学)[PSYoungGen:2291
我最近看到了两个非常好的和有教育意义的语言讲座: This first one由 Herb Sutter 撰写,介绍了 C++0x 的所有漂亮和酷炫的特性,为什么 C++ 的 future 似乎比以往
我们正在运行 gerrit 2.10.7,我们偶尔会遇到损坏的对象没有被 gerrit gc 修复的问题,即使 git gc 可以很好地修复它们。 另一方面,我读到 gerrit gc 会创建优化其他
我试图避免 Full GC(来自下面的 gc.log 示例)在生产中的 Tomcat 中运行 Grails 应用程序。关于如何更好地配置 GC 有什么建议吗? 14359.317:[完整 GC 143
我试图通过在析构函数中使用 console.WriteLine() 来确保释放某个类的实例,但输出从未出现。 我仔细搜索了任何挥之不去的引用资料以及事件订阅,但没有找到。只是为了我自己的理智,在我继续
之前看过一篇文章,说FGC影响时序,导致application出错结果。 代码示例如下: long start = System.currentTimeInMillis(); doSomething(
在 Java 中,我们可以使用 System.gc() 方法来建议 GC。今天我从this link开始了解C#中的GC.Collect()方法。 . 但我对解释有些不清楚。 第一行。 Forces
我理解 Python GC 有两种工作方式: 1) 基本引用计数 - 当“name”设置为“Tom”时,“John”下方的引用计数为零 name = "John" name = "Tom" (Refe
按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
今天我们使用并发标记清除,具体如下: -XX:+UseConcMarkSweepGC 我看到一些文章推荐使用这种形式的附加参数: -XX:+UseConcMarkSweepGC -XX:+CMSInc
当我运行我的程序时,logcat 显示很多 GC Activity 喜欢 GC freed 10324 objects/ 510376 bytes in 103 ms GC freed 10324 o
2013-11-26T10:19:30.011+0800: [GC [ParNew: 2432484K->19997K(2696640K), 0.0378270 secs] 5560240K->315
在执行 GC 时,JVM 会遍历 Activity 对象,并清除未标记的对象。 根据: How to Tune Java Garbage Collection “Full GC的执行时间相对Minor
我有一个分布式缓存应用程序(内存绑定(bind),由于与集群中其他节点的交互而具有网络 I/O)在 JVM 1.7.0_51 中运行,带有 G1 垃圾收集器。这是 JVM 配置: -server -X
首先,我想让您知道,这是一个理论问题而不是实际问题,我只是好奇弱引用对象是如何被释放的。让我们快速记住 Java 中的弱引用是什么。粗略地说WeakReference意味着当没有指向“我”的强引用时,
这是运行大约 10 分钟后的输出。 Heap PSYoungGen total 7040K, used 0K [0x24060000, 0x247c0000, 0x26790000)
我正在运行一个应用程序,在 Weblogic 上使用 java 5 和 CMS 垃圾收集器。在垃圾收集日志中,我看到了消息日志,其中大部分消息我可以使用 Sun 的 Java HotSpot 虚拟机中
我有一个 ConcurrentMap> map = new ConcurrentHashMap>(); 并且希望当 SoftReference 的引用被 GC 时从映射中删除键/值对。 我该如何实现这
我是一名优秀的程序员,十分优秀!