- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我正在尝试跨多个序列查找最长公共(public)子串 (LCS)。
CPAN上有很多模块实现了2个序列的LCS算法,比如 Algorithm::Diff和 String::LCSS_XS ,但我很难将它们扩展到使用 2 个以上的序列,因为跨多个序列的 LCS 不一定是其中任何两个序列之间的 LCS。
值得注意的是,尽管它的名字是 Algorith::MLCS实际上并不返回 LCS,而是返回多个数组的所有公共(public)元素(也是非连续的)。我的印象是它被设计破坏了,但我可能错了。
Algorithm::Diff和 Algorith::MLCS解决最长公共(public)子序列问题,而不是最长公共(public)子串问题。
是否有明显的方法来扩展 n=2 算法,或者我是否必须实现我的版本?如果是,如何?
谢谢。
最佳答案
使用 Tree::Suffix 可以很容易地解决这个问题模块。
例子:
#!/usr/bin/env perl
use Modern::Perl;
use Bio::SeqIO;
use Tree::Suffix;
my $seqio = Bio::SeqIO->new(
-file => "fasta_sequences.txt",
-format => "Fasta");
my @seqs;
while (my $seqobj = $seqio->next_seq) {
push @seqs, $seqobj->seq;
}
my $tree = Tree::Suffix->new(@seqs);
my @lcss = $tree->lcs;
say $_ for @lcss;
关于algorithm - 跨多个序列的最长公共(public)子串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20584536/
我正在尝试创建一个程序,其中字符串的前三个字符重复给定次数,如下所示: foo('Chocolate', 3) # => 'ChoChoCho' foo('Abc', 3) # => 'AbcAbcA
我有以下字符串: std::string str = "Mode:AAA:val:101:id:A1"; 我想分离一个位于 "val:" 和 ":id" 之间的子字符串,这是我的方法: std::st
DNA 字符串可以是任意长度,包含 5 个字母(A、T、G、C、N)的任意组合。 压缩包含 5 个字母(A、T、G、C、N)的 DNA 字母串的有效方法是什么?不是考虑每个字母表 3 位,我们可以使用
是否有一种使用 levenstein 距离将一个特定字符串与第二个较长字符串中的任何区域进行匹配的好方法? 例子: str1='aaaaa' str2='bbbbbbaabaabbbb' if str
使用 OAuth 并使用以下函数使用我们称为“foo”(实际上是 OAuth token )的字符串加密 key public function encrypt( $text ) { // a
我是一名优秀的程序员,十分优秀!