c# - 为什么性能指标有所不同？-6ren

c# - 为什么性能指标有所不同？

转载作者：太空狗更新时间：2023-10-29 21:41:31

我有一个简单的方法，可以将数组从一种类型转换为另一种类型。我想找出哪种方法最快。但是到目前为止，我得到了不同的结果，从中我无法得出结论，哪种方法实际上要快得多。

由于转换仅涉及分配内存，读取数组和转换值，因此我感到惊讶的是，这些值并不更稳定。我想知道如何进行准确的测量，这些测量是有意义的，并且一天到一天都不会改变。
一天之间的差异约为20％。

当然，.NET 3.5和4.0的JITer，调试和 Release模式，不在调试器下运行可执行文件(禁用JIT优化直到禁用它)，在DEBUG和RELEASE之间生成C#编译器的代码(主要是nop)之间存在差异。 IL代码中的操作和更多临时变量)。

using System;
using System.Collections.Generic;
using System.Diagnostics;

namespace PerfTest
{
    class Program
    {
        const int RUNS = 10 * 1000 * 1000;


        static void Main(string[] args)
        {
            int[] array = new int[] { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43 };

            var s2 = Stopwatch.StartNew();
            for (int i = 0; i < RUNS; i++)
            {
                float[] arr = Cast(array);
            }
            s2.Stop();
            GC.Collect();

            var s3 = Stopwatch.StartNew();
            for (int i = 0; i < RUNS; i++)
            {
                float[] arr = Cast2(array);
            }
            s3.Stop();
            GC.Collect();

            var s4 = Stopwatch.StartNew();
            for (int i = 0; i < RUNS; i++)
            {
                var arr = CastSafe(array);
            }
            s4.Stop();


            Console.WriteLine("Times: {0} {1} {2}", s2.ElapsedMilliseconds, s3.ElapsedMilliseconds, s4.ElapsedMilliseconds);
        }

        // Referece cast implementation to check performance
        public static unsafe float[] Cast(int[] input)
        {
            int N = input.Length;
            float[] output = new float[N];

            fixed (int* pIStart = &input[0])
            {
                int* pI = pIStart;
                fixed (float* pOStart = &output[0])
                {
                    float* pO = pOStart;

                    for (int i = 0; i < N; i++)
                    {
                        *pO = (float)*pI;
                        pI++;
                        pO++;
                    }
                }
            }

            return output;
        }

        // Referece cast implementation to check performance
        public static unsafe float[] Cast2(int[] input)
        {
            int N = input.Length;
            float[] output = new float[N];
            fixed (int* pIStart = &input[0])
            {
                int* pI = pIStart;
                fixed (float* pOStart = &output[0])
                {
                    float* pO = pOStart;

                    for (int i = 0; i < N; i++)
                    {
                        pO[i] = (float) pI[i];
                    }
                }
            }

            return output;
        }
        public static float[] CastSafe(int[] input)
        {
            int N = input.Length;
            float[] output = new float[N];

            for (int i = 0; i < input.Length; i++)
            {
                output[i] = (float)input[i];
            }

            return output;
        }
    }
}

我明白了

时间:1257 1388 1180

时间:1331 1428 1267

时间:1337 1435 1267

时间:1208 1414 1145

由此看来，傻瓜安全变体看起来比任何不安全变体都快，尽管边界检查消除了不安全方法应该使它至少和不快一样快。
只是为了好玩，我还通过LCG(DynamicMethod)编译了相同的IL代码，该代码似乎比这些方法中的任何一个都要慢，尽管委托(delegate)调用的额外成本似乎在这里没有起到很大的作用。

for循环确实执行此代码一千万次，这将产生稳定的结果。为什么我在这里看不到任何差异？使用实时作为进程优先级也没有帮助(psexec -realtime可执行文件)。如何获得可靠的数字？

我的测试确实包括

双四核计算机

Windows 7 32/64位版本

.NET Framework 3.5/4.0

可执行文件的32/64位版本。

如果使用探查器，我不确定他是否会进一步扭曲测量结果。由于他确实会不时中断我的应用程序以获取调用堆栈，因此他肯定会破坏任何可能有助于提高性能的缓存位置。如果有任何具有更好的(数据)缓存局部性的方法，我将无法通过探查器找到它。

编辑1:
考虑到我没有实时操作系统，我现在对我的测量进行采样。因为对于一个线程，我有一个15毫秒的时间窗口授予Windows计划程序，所以如果我测量的时间少于15毫秒，则可以将其排除在计划程序之外。如果我测量得太短，我最终将获得很小的滴答声计数，这不会告诉我太多。

为了获得稳定的值，我需要足够长的时间来让操作系统定期执行其操作。经验测试表明，一次测量应该花费30秒钟以上的时间。

然后将此时间跨度划分为远低于15ms的采样时间跨度。然后，我将获得每个样本的时序信息。从样本中，我可以提取最小/最大和平均值。这样，我还可以看到第一次的初始化效果。
现在的代码看起来像这样

class Program
{
    const int RUNS = 100 * 1000 * 1000; // 100 million runs will take about 30s
    const int RunsPerSample = 100;      // 100 runs for on sample is about 0,01ms << 15ms

    static void Main(string[] args)
    {
        int[] array = new int[] { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43 };
        long[] sampleTimes = new long [RUNS/RunsPerSample];

        int sample = 0;
        for (int i = 0; i < RUNS; i+=RunsPerSample)
        {
            var sw = Stopwatch.StartNew();
            for (int j = i; j < i+RunsPerSample; j++)
            {
                float[] arr = Cast(array);
            }
            sw.Stop();
            sampleTimes[sample] = sw.ElapsedTicks;
            sample++;
        }
        Console.WriteLine("SampleSize: {0}, Min {1}, Max {2}, Average {3}",
            RunsPerSample, sampleTimes.Min(), sampleTimes.Max(), sampleTimes.Average());

这些测试的值仍会发生变化(<10％)，但是我认为，如果我创建一个我的值的直方图并丢弃可能由OS，GC引起的10％的最高值，...我真的可以我可以信任的稳定数字。

样本大小:100，最小值25，最大值86400，平均值28,614631

SampleSize:100，最小值24，最大值86027，平均值28,762608

SampleSize:100，最小值25，最大值49523，平均值32,102037

SampleSize:100，最小值24，最大值48687，平均值32,030088

编辑2:
直方图显示测量值不是随机的。它们看起来像 Landau distribution，应该为我提供正确的近似算法稳定值。我希望在.NET中存在类似 ROOT的东西，在其中我可以交互地将正确的分布函数拟合到我的数据并获取结果。

下面是使用 MSChart控件生成直方图的代码:

using System.Collections.Generic;
using System.Drawing;
using System.Linq;
using System.Windows.Forms;
using System.Windows.Forms.DataVisualization.Charting;

namespace ConsoleApplication4
{
    public partial class Histogram : Form
    {
        public Histogram(long [] sampleTimes)
        {
            InitializeComponent();

            Series  histogramSeries = cHistogram.Series.Add("Histogram");

            // Set new series chart type and other attributes
            histogramSeries.ChartType = SeriesChartType.Column;
            histogramSeries.BorderColor = Color.Black;
            histogramSeries.BorderWidth = 1;
            histogramSeries.BorderDashStyle = ChartDashStyle.Solid;

            var filtered = RemoveHighValues(sampleTimes, 40);
            KeyValuePair<long,int>[] histoData = GenerateHistogram(filtered);

            ChartArea chartArea = cHistogram.ChartAreas[histogramSeries.ChartArea];
            chartArea.AxisY.Title = "Frequency";

            chartArea.AxisX.Minimum = histoData.Min( x=>x.Key );
            chartArea.AxisX.Maximum = histoData.Max( x=>x.Key );

            foreach (var v in histoData)
            {
                histogramSeries.Points.Add(new DataPoint(v.Key, v.Value));
            }

            chartArea.AxisY.Minimum = 0;
            chartArea.AxisY.Maximum = histoData[0].Value + 100;
        }

        // Count the occurence of each value of input and return an array with the value as key and its count as value
        // as ordered list starting with the highest counts.
        KeyValuePair<long,int>[] GenerateHistogram(long [] input)
        {
            Dictionary<long, int> counts = new Dictionary<long, int>();
            foreach (var value in input)
            {
                int old = 0;
                if (!counts.TryGetValue(value, out old))
                {
                    counts[value] = 0;
                }
                counts[value] = ++old;
            }

            var orderedCounts = (from x in counts
                                 orderby x.Value descending
                                 select x).ToArray();

            return orderedCounts;
        }

        long[] RemoveHighValues(long[] input, int maxDifference)
        {
            var min = input.Min();
            var max = input.Max();

            long[] filtered = input;

            while (max - min > maxDifference) // remove all values wich differ by more than maxDifference ticks
            {
                filtered = input.Where(x => x < max).ToArray();
                max = filtered.Max();
            }

            return filtered;

        }
    }
}

最佳答案

您正在谈论的是每个方法调用的平均差异约为百分之一纳秒。 Windows并不是实时操作系统。这些测量结果将尽可能稳定。

顺便说一句，the jitter will eliminate the bounds check inside your CastSafe method。如果您能找到比这更快的速度，我会感到非常惊讶。

(如果瓶颈是CPU，那么您可以通过使用 Parallel.For 而不是普通的for循环来提高性能，但要确定您需要针对实际数据进行测试。例如，对于一个43整数的数组，而不是一个43,000,000整数的数组。)

关于c# - 为什么性能指标有所不同？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/6803662/

文章推荐： c# - 模拟 UdpClient 进行单元测试

文章推荐： c++ - SVM OpenCV c++ 预测只返回 1

文章推荐： c# - 使用 C# 以编程方式登录亚马逊

文章推荐： c++ - 在编译时根据 printf 格式检查参数的可移植方式，C++

Azure SQL 指标
我在 Azure 中找不到几个 SQL 指标。任何人都可以帮助如何设置以下主题的指标。 1)产能利用率不足 2)池外的数据库数量 3)扩大规模 4)连接超时提前致谢。最佳答案实际上，这些并不是
普罗米修斯 json 指标
我要监控的应用程序提供了一个用于健康检查的 api 端点，它以 json 格式响应指标。例如: $ curl https://example.com/api/stats {"status":"suc
metrics - 测量软件配置代码的工作量/指标
我正在考虑用于分析软件开发工作的软件指标。当我考虑在面向对象的软件中使用类似功能点的指标时，我遇到了一个有趣的挑战/问题。考虑一个业务规则引擎。它是一种应用程序，由运行业务规则所需的组件组成，然后将
普罗米修斯 json 指标
我要监控的应用程序提供了一个用于健康检查的 api 端点，它以 json 格式响应指标。例如: $ curl https://example.com/api/stats {"status":"suc
Javascript Clusterfck 指标
因此，我正在将旧的数据可视化转换为新平台，但我对他们的社区排序功能有点困惑。在原始代码中，作者似乎使用了带有余弦相似度计算器的凝聚聚类。我认为在 Javascript 中解决这个问题的最佳方法是使用
algorithm - 如何操纵围绕中心值震荡的价格序列(指标)？
我不是专业程序员，但我正在尝试改变一些技术指标在名为 TradeStation 的金融图表包中的显示方式(与特定图表供应商无关)。这就是问题所在:大多数指标都是围绕零点绘制的，有时它们会靠近零点摆动
mysql - 指标/报告生成问题
我们存储了大量来 self 们服务的指标(大约 8000 万个事件)。我们必须根据数据生成报告。我的问题比较笼统，哪些工具可以满足您的指标/报告需求？有什么推荐的吗？我们使用 Apache 编写日
lighthouse - 受使用内容可见性属性影响的累积布局偏移 (CLS) 指标？
我们网站上的页面的 CLS 一直接近于零。这是有道理的，因为它们是服务器呈现的 HTML 页面，具有简单的静态布局。最近我们添加了 content-visibility: auto 的使用，如下所示
r - 在R中将因子矩阵转换为二进制(指标)矩阵的最有效方法
我能想到几种方法来转这种类型的矩阵(数据框): dat = data.frame( x1 = rep(c('a', 'b'), 100), x2 = rep(c('x', 'y
metrics - Dropwizard 指标 - 如何在报告间隔后重置计数器
我正在使用 codahale 指标(现在是 dropwizard 指标)来监控我系统中发生的一些“事件”。我正在使用 counters跟踪“事件”发生次数的指标。我检查了记者为我的计数器指标打印的值
continuous-integration - 持续集成投资返回率/指标
关闭。这个问题需要更多focused .它目前不接受答案。想改善这个问题吗？更新问题，使其仅关注一个问题 editing this post . 11 个月前关闭。 Improve this que
Kubernetes:如何获取节点的磁盘/cpu 指标
在不使用 Heapster 的情况下，有没有办法收集有关 Kubernetes 集群中节点的 CPU 或磁盘指标？ Heapster 最初是如何收集这些指标的？最佳答案 Kubernetes 监控在
xgboost 正确使用 auc 指标
对于二元分类问题，我有一个略微不平衡的数据集，正负比为 0.6。我最近从这个答案中了解到了 auc 指标:https://stats.stackexchange.com/a/132832/12822
python - 如何重置 Keras 指标？
为了做一些参数调整，我喜欢用 Keras 循环一些训练函数。但是，我意识到在使用 tensorflow.keras.metrics.AUC() 时作为度量，对于每个训练循环，都会将一个整数添加到 au
c# - 如何通过短信通知添加自定义 Azure 指标？
我使用 Azure，现在我想在特定情况下添加短信通知。当我使用基于日志的指标时，它效果很好，但我想针对特定异常创建通知。下一个流程:抛出异常 => Azure 知道识别它 => Azure 发送有
azure - 访问 Azure 指标
我正在尝试访问给定cloudService的指标我有以下代码: var metricsClient = new MetricsClient(new CertificateCloudCredentia
R 指标 RMSE 不适用于分类模型
我正在尝试使用 R 和 xgboost 来研究我的模型。训练模型总体上效果很好，但对于插入符来说，度量存在一些问题。我尝试为类列设置一个因子，但仍然没有结果。我的数据 ID var1var2TA
swift - 作为全局属性的 Activity 指标
我对编程还很陌生，有时它会用非常基本的概念来困扰我。我在我的 tableviewcontroller 中定义了一个 Activity 指示器作为 Outlet。 @IBOutlet weak var
tensorflow - 如何使用功能来评估不用于训练模型的自定义 TensorFlow 指标
我正在训练一个进行序列预测的模型。例如，给定某人之前写过的 10 个单词，我正在训练 LSTM 来预测他们将写的下一个单词。我有一个有时可以工作的模型，因此我想创建一个指标来跟踪模型通过词性标签预测下
java - 为什么我没有获得 hystrix 指标？
我正在尝试使用 hystrix 来监控某个网络调用。但我尝试监控的所有指标始终为空。我做错了什么？我通过实现一个(某种程度上)RESTful 接口(interface)来模拟网络调用，该接口(int

太空狗

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

c# - 为什么性能指标有所不同？