perl - 在 Perl 中访问字符串中的单个字符时，是 substr 还是拆分为数组更快？-6ren

perl - 在 Perl 中访问字符串中的单个字符时，是 substr 还是拆分为数组更快？

转载作者：行者123 更新时间：2023-12-04 10:05:51

我正在编写一个 Perl 脚本，我需要在其中循环字符串的每个字符。有很多字符串，每一个都有 100 个字符长(它们是很短的 DNA 序列，以防你想知道)。

那么，使用 substr 是否更快？一次提取每个字符，还是更快 split将字符串放入数组中，然后遍历数组？

在等待答案的同时，我想我会阅读有关如何在 Perl 中进行基准测试的内容。

最佳答案

这实际上取决于您对数据的处理方式——但是，嘿，您的最后一个问题是正确的!不要猜测，基准测试。

Perl 提供了 Benchmark正是这种事情的模块，并且使用它真的非常简单。这是一个开始使用的小示例代码:

#!/usr/bin/perl
use strict;
use warnings;
use Benchmark qw(cmpthese);

my $dna;
$dna .= [qw(G A T C)]->[rand 4] for 1 .. 100;

sub frequency_substr {
  my $length = length $dna;
  my %hist;

  for my $pos (0 .. $length) {
    $hist{$pos}{substr $dna, $pos, 1} ++;
  }

  \%hist;
}

sub frequency_split {
  my %hist;
  my $pos = 0;
  for my $char (split //, $dna) {
    $hist{$pos ++}{$char} ++;
  }

  \%hist;
}

sub frequency_regmatch {
  my %hist;

  while ($dna =~ /(.)/g) {
    $hist{pos($dna)}{$1} ++;
  }

  \%hist;
}


cmpthese(-5, # Run each for at least 5 seconds
  { 
    substr => \&frequency_substr,
    split => \&frequency_split,
    regex => \&frequency_regmatch
  }
);

和一个样本结果:

         Rate  regex  split substr
regex  6254/s     --   -26%   -32%
split  8421/s    35%     --    -9%
substr 9240/s    48%    10%     --

结果 substr 出奇的快。 :)

关于perl - 在 Perl 中访问字符串中的单个字符时，是 substr 还是拆分为数组更快？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/3983272/

文章推荐： c - 搜索数据并将数据从一个文件写入另一个文件

文章推荐： regex - 使用正则表达式在字符串中精确匹配一次出现

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

perl - 在 Perl 中访问字符串中的单个字符时，是 substr 还是拆分为数组更快？