performance - 如何在Rebol中对一系列功能进行基准比较？-6ren

performance - 如何在Rebol中对一系列功能进行基准比较？

转载作者：行者123 更新时间：2023-12-04 22:48:19

我最近询问了fastest/most efficient way to count newlines in Rebol，我现在需要确定在给定情况下哪种方法最好。

一些示例方案：短文本，换行更少；短文本，许多换行符；中/长文本，许多换行符（代码）；中/长文本，换行符较少（文章）。

我有一些不确定性：如果我一个接一个地跑，第二个测试会被第一个测试污染吗？对于不同的场景（优化），要求不同的功能将有多大的差异，而对于所有功能，一个功能都可以满足（便利）？我需要两个Rebol 2.7.8和Rebol 3的基准。

这是我要测试的一组特定功能，尽管也可以使用更通用的答案：

reduce [
    "@rebolek"
    func [text [string!] /local i][
        parse text [(i: 1) any [thru newline (++ i)]] i
    ]

    "@darius"
    func [text [string!] /local tmp][
        tmp: sort join text "^/"
        1 + subtract index? find/last tmp "^/" index? find tmp "^/"
    ]

    "@endo64"
    func [text [string!]][
        (length? text) - (length? remove-each v text [v = #"^/"])
    ]

    "@BrianH"
    function [text [string!]] [
        i: 1
        find-all text newline [++ i]
        i
    ]

    "@MaxV"
    func [text [string!]][
        write %.mytext text
        text: read/lines %.mytext
        delete %.mytext
        length? text
    ]
]

最佳答案

在REBOL（R2和R3）中进行配置分析所面临的挑战是三方面的。定时，循环和内存使用。

定时：

在某些操作系统上，默认计时不精确（例如Windows）。这可以通过创建更大的环路来大大缓解，该环路基本上可以将测试扩展到可接受的时序裕度。您还可以创建更好的计时器，例如我为Windows构建的chrono lib（chrono-lib.r）。

它还包括一个延时功能，使测试块变得容易（基本上是针对Windows的更精确的“ DT”）。

循环播放：

这是很明显的事情，当您花费时间来消除某些OS /多任务处理开销时，可以多次运行代码并将重复次数除以得到平均值。这通常足以获得一个好主意。

但是，循环本身本身是相当昂贵的。迭代函数具有其自己不可忽略的开销。因此，在循环某些代码之前，请确保您使用的循环是最佳的，尤其要确保您使用的是本机迭代器函数，因为循环的最终结果可能比您要分析的代码慢。在R2中，在大多数情况下，FOREACH和LOOP是更快的循环。在开始循环之前，FOREACH的绑定开销很小，但是在我的广泛测试中，这几乎没有影响，因为它只发生一次，与运行几秒钟无关。

在R3中，由于R2中的某些mezz循环已成为本机，因此迭代器函子的速度有所提高，因此您必须检查它们以查看。

记忆：

这是事情变得难以预测的地方。 REBOLs GC在进行性能分析时相当麻烦。它不仅速度很慢，而且还是不可预测的，实际上无法进行优化，并且随着REBOL内存占用量的增加而减慢速度（实际上，这超出了人们的想象）。

减多少让我们来看看：

这是我必须基准测试内存使用和执行速度的脚本。它生成的图形可以向我显示一个彼此之间的关系。它具有关闭垃圾收集器的一个选项...，您将看到它如何影响分析...带有和不带有该图形的图形都非常清楚：

rebol [
    title: "profiling tests with graphics"
    author: "Maxim Olivier-Adlhoch"
    purpose:  "given a few metrics and code blocks, will plot out the time and memory use for each repetition."
]

;----
; test metrics
loops: 2000
repetitions: 500

;----
; test options
turn-off-garbage-collector?: false

;----
; output gfx prefs
mem-color: red
time-color: sky
bg-color: black
gfx-size: 600x400
margins: 100x100
lw: 2 ; line-width
label-color: white * .85
border-color: gray * 0.5
slices: 10 ; how many labels on the edges of the graphics.


;----
; globals
plot-data: []

;----
;- functions
platform: does [
     select [
        1 AMIGA
        2 OSX
        3 WIN32
        4 LINUX
    ] system/version/4
]


;----
; make sure timer resolution is decent on all platforms
;----
either ( platform = 'WIN32 ) [
    either exists? %libs/windows-chrono.r  [
        do %libs/windows-chrono.r
    ][
        ask "download and save windows-chrono from rebol.org ?  ^/^/    * press ENTER to confirm^/    * press ESCAPE to halt."
        make-dir %libs/
        write %libs/windows-chrono.r read  http://www.rebol.org/download-a-script.r?script-name=windows-chrono.r
        print "windows chrono downloaded"
    ]
][
    ; on other platforms, the OS timer resolution tends to be better, we can just use delta-time
    time-lapse: :delta-time
]
;   time-lapse: :delta-time


;----
; TEST CODE INITIALISATIONS
blk: make block! repetitions

print "===================="
print "running tests"

;----
; SETUP TEST OPTION(S)
if turn-off-garbage-collector? [
    recycle/off
]

;--------------------------------------------
; PERFORM AND PLOT TESTS
;--------------------------------------------
repeat i repetitions [
    ;--------------------------------------------
    ; PUT YOUR LOOP INIT CODE HERE:
    ;--------------------------------------------
    tmp: last append/only blk copy []
    time: time-lapse [

        loop loops [
            ;--------------------------------------------
            ; PUT YOUR TEST CODE HERE:
            ;--------------------------------------------
            ; here we just accumulate RAM...
            append tmp make string! 1000
        ]
    ]
    memory: stats
    append plot-data reduce [ time memory]
    prin "."
]


;-------------------------
; extract plot data scale
;-------------------------
time-x: 0:00
stat-y: 0

foreach [time stat] plot-data [
    time-x: max time-x time
    stat-y: max stat-y stat
]


time-scale: (gfx-size/y / to-decimal time-x )
mem-scale:  gfx-size/y / stat-y

print ""
?? time-scale
?? mem-scale

;-------------------------
; build gfx
;-------------------------

;-------
; lines
i: 0
mem-line: compose [line-width lw pen (mem-color ) line () ]
time-line: compose [line-width lw pen (time-color ) line () ]
foreach [time ram] plot-data [
    time: to-decimal time
    ;?? time
    ;print time * time-scale

    append mem-line margins + to-pair  reduce [ x: to-integer (i / (repetitions - 1) * gfx-size/x) to-integer ( ram  * mem-scale  )]
    append time-line margins + to-pair reduce [ x                                            to-integer ( time * time-scale  )]
    i: i + 1
]

;------
;scales
scale-drw: compose [
    line-width 1
    pen (border-color) box (margins) (margins + gfx-size)
]

repeat i (slices + 1) [
    ii: i - 1
    append scale-drw reduce [
        'pen mem-color
        'text margins + to-pair reduce [ -50   (gfx-size/y - (ii / slices * gfx-size/y ) ) - 5 ]
             rejoin [ to-string round/to (ii / slices * stat-y / 1'000'000) 0.01  " MB" ]

        'pen time-color
        'text margins + to-pair reduce [ gfx-size/x   (gfx-size/y - (ii / slices * gfx-size/y ) ) - 5 ]  
             rejoin [ to-string round/to (1000 * ii / slices * to-decimal time-x) 0.1   "ms" ]

        'pen border-color
        'text margins + to-pair reduce [ ((ii / slices * gfx-size/x ) )    gfx-size/y + 10 ]  
             rejoin [ to-string to-integer( ii / slices * repetitions)   ]
    ]
]

view layout compose/deep  [
    box (margins * 2 + gfx-size) bg-color effect [draw [
        translate (0x1 * (margins * 2 + gfx-size)) scale 1 -1.0  (mem-line) (time-line) 
        reset-matrix
        (scale-drw)
    ]]
]

随意复制和编辑此脚本，这是一种非常简单的绘图机制……我敢肯定，您可以添加其他曲线（例如正在测试的函数的输出值的曲线）。

在此脚本的顶部，您可以看到有一个禁用GC的选项...在此循环的测试代码中，我们只是分配RAM，以查看GC如何影响整体性能。

这是启用GC的运行：

您会看到执行受到阻碍，因为GC一直在监视并中断该过程。

随着RAM的增加（红线），执行速度会不断降低。请注意，所有块都是预先分配的，因此这不是由于内部存储器复制引起的。

这是禁用GC的运行：

您可以清楚地看到操作的线性度。

您在两次运行中都有不规则的跳跃是由于正常的OS多任务处理。

请注意，两个测试中的最佳速度是相同的。大约5毫秒...但是在启用GC的运行中，平均值只会越来越差。

因此，当我测试任何代码时，我总是将GC关闭，除非该代码生成的立即内存使该任务很快耗尽了内存。或者，您可以在代码中的关键点进行回收/关闭回收/打开，以减轻方程式中的这一部分问题。当调用recycle / on时，如果超出阈值，它将立即进行清理。

请注意，内存分配的复杂性会影响GC。这不仅会影响RAM的数量，还会影响正在构建的值的数量，这将带来很大的后果。使用上面的探查器，您可以构建指数级缓慢的算法，当这些算法开始实时运行时，仅300MB就几乎无法使用。

绑定并创建许多复杂的对象是一件事，它将彻底破坏rebol中任何速度的假装。如果要创建大型数据集，使用块层次结构而不是对象层次结构确实更好。

希望以上脚本能帮助您介绍一些要测试的内容。

关于performance - 如何在Rebol中对一系列功能进行基准比较？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/14988163/

文章推荐： ocaml - 是否有其他方法可以解构 OCaml 中的选项类型？

文章推荐： rest - 使用 rest 时在 BizTalk 中获取 HTTP 错误代码

文章推荐： java - 解释一下用JAVA写的这行

python - Python 基准
我想创建一个 Python 基准测试列表。现在我只找到了 this 中的标准基准测试问题和一些来自 Computer Language Benchmarks Game . Python 还有其他基准测
Hadoop 基准 : TestDFSIO
我正在使用 apache 提供的基准文件 TestDFSIO 测试我的 hadoop 配置。我正在根据本教程(资源 1)运行它: http://www.michael-noll.com/blog/20
ruby - 基准 ruby
我刚刚安装了 Ruby 企业版，想对我的系统 Ruby 运行一些基准测试。是否有我应该实现的规范基准测试？最佳答案最有趣最深入Ruby benchmarks Antonio Cangiano 的系
python - 可视化 ffmpeg 基准
我已经生成了基准，用于比较使用 ffmpeg 工具缩小视频文件 (mp4) 的两种方法。基准以这种格式记录: x.mp4 Output_Resolution : 360p Method : A re
codeigniter 基准 {memory_usage} 安全
我正在使用 codeigniter 制作一个网站。如果用户在他的评论中写入 {memory_usage} 2.75MB 将显示给他。它不会给 codeigniter 编写的代码带来安全漏洞吗？有什么
.net - 基准 XSLT 性能
我正在尝试对 XSLT 的两个版本进行基准测试。目前我使用 Visual Studio 进行调试，因为从 .NET 组件调用的 xml 转换。 VS 2010 是我用于开发的 IDE。我得到的唯一线
c - 如何使用源代码测量每个节点的 MPI 基准？
我想知道如何测量每个节点的内存带宽(流基准)。我的这个程序仅在一个节点上进行测量，进程和线程的数量如下: MPI_Comm_size(MPI_COMM_WORLD, &numranks); MPI_C
c# - EF 5 基准
我正在关注 performance test Dapper 社区创建的。目前，我在运行测试 10000 次后得到以下信息: EF 5 = 21595 毫秒 ADO.NET = 52183 毫秒小巧
c++ - 超过理论峰值 FLOPS 基准
为了测量 CPU 的峰值 FLOPS 性能，我编写了一个小的 C++ 程序。但是测量结果给我的结果比我的 CPU 的理论峰值 FLOPS 大。怎么了？这是我写的代码: #include #incl
java - 基准 JUnit AllTests
有没有办法在 JUnit 测试套件中放置简单的开始/停止计时？当我创建一个测试套件类时，它看起来像这样，我可以运行它。但是我怎么能在这里放一个简单的长开始时间变量来显示所有测试运行了多长时间？ pu
mysql - 在同一个表中的多个线程上批量插入 MySQL 基准
我想测试MySQL数据库的InnoDB和MyRock引擎之间的高强度写入。为此，我使用 sysbench 进行基准测试。我的要求是: 多线程并发写入同一张表。支持批量插入(每次插入事务都会插入大量记
performance - 基准 Nodejs 项目
我正在尝试构建一个 Nodejs Web 应用程序。当我添加更多代码时，最好有一种方法来测试此类更改对性能的影响，如果可能的话，以及我的应用程序在哪些方面花费最多时间。我目前正在使用 mocha 作为
javascript - 为基于网络的动画设置 FPS 基准？
我希望编写一个简单的每秒帧数动画基准 Javascript 实用程序。 FPS 在这里可能是一个模糊的术语，但理想情况下，它可以让我更准确地比较和衡量不同动画 (CSS3/canvas/webgl)
python - 基准 Python 程序
我是 Python 新手。这是我的第一种解释语言。到目前为止，我曾经学习过Java。因此，当 Java 程序第一次运行时，它的执行速度比下一次要慢。reasi 正在缓存。 import time de
Apache 基准 HTTPS 失败
我在 Ubuntu 虚拟机中使用 Apache 2.4.2。我用它来加载测试，向某些 HTTPS url 发送请求。失败请求数为零。但是我的请求都无法真正处理(已经在数据库中查找)。使用相同的 url
javascript - WebGL 基准 - 我应该创建什么样的测试？
(我不确定这是否应该在 https://softwareengineering.stackexchange.com/ 上，如果您认为是，请评论) 我即将为我的学士论文创建 WebGL 实现的基准。我不
java - 有没有好的 Clojure 基准？
编辑: Clojure 基准测试已达到 the Benchmarks Game 。我已经制作了这个问题社区 wiki 并邀请其他人保持更新。有人知道 Clojure 的性能基准吗？我自己做了一些
json - 基准 : BSON vs JSON
关注 this benchmark BSON 需要更多的磁盘空间和时间来创建、序列化、反序列化和遍历所有元素。 BSON 的一大优势是，它的遍历速度要快得多。那么这个基准有什么问题呢？最佳答案你的
benchmarking - 基准 channel 创建 NextFlow
我正在 NextFlow 上执行分散-聚集操作。它看起来像下面这样: reads = PATH+"test_1.fq" outdir = "results" split_read_ch = chan
linux - Apache 基准 HTTPS 问题
我无法让apache benchmark与我的网站配合使用。每当我发出此命令时 ab https://example.com/ 我会得到这个输出错误: This is ApacheBench, Ver

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

performance - 如何在Rebol中对一系列功能进行基准比较？