C# 扩展方法比链式替换慢，除非在紧密循环中。为什么？-6ren

C# 扩展方法比链式替换慢，除非在紧密循环中。为什么？

转载作者：太空狗更新时间：2023-10-29 23:12:12

我有一个扩展方法可以从字符串(电话号码)中删除某些字符，与链式替换调用相比，它的执行速度比我认为应该的要慢得多。奇怪的是，在一个循环中，如果循环运行大约 3000 次迭代，它会取代 Replace 东西，之后它会更快。低于此值，链接替换速度更快。这就像我的代码有一个固定的开销，而 Replace 没有。这会是什么!？

快看。当只测试10个数字时，我的大约需要0.3ms，而Replace只需要0.01ms。一个巨大的差异!但是当运行 500 万时，我的大约需要 1700 毫秒，而替换大约需要 2500 毫秒。

电话号码只会有 0-9, +, -, (, )

相关代码如下:构建测试用例，我在玩 testNums。

        int testNums = 5_000_000;
        Console.WriteLine("Building " + testNums + " tests");
        Random rand = new Random();
        string[] tests = new string[testNums];
        char[] letters =
        {
            '0','1','2','3','4','5','6','7','8','9',
            '+','-','(',')'
        };
        for(int t = 0; t < tests.Length; t++)
        {
            int length = rand.Next(5, 20);
            char[] word = new char[length];
            for(int c = 0; c < word.Length; c++)
            {
                word[c] = letters[rand.Next(letters.Length)];
            }
            tests[t] = new string(word);
        }

        Console.WriteLine("Tests built");
        string[] stripped = new string[tests.Length];

使用我的扩展方法:

        Stopwatch stopwatch = Stopwatch.StartNew();
        for (int i = 0; i < stripped.Length; i++)
        {
            stripped[i] = tests[i].CleanNumberString();
        }
        stopwatch.Stop();
        Console.WriteLine("Clean: " + stopwatch.Elapsed.TotalMilliseconds + "ms");

使用链式替换:

        stripped = new string[tests.Length];
        stopwatch = Stopwatch.StartNew();
        for (int i = 0; i < stripped.Length; i++)
        {
            stripped[i] = tests[i].Replace(" ", string.Empty)
                        .Replace("-", string.Empty)
                        .Replace("(", string.Empty)
                        .Replace(")", string.Empty)
                        .Replace("+", string.Empty);
        }
        stopwatch.Stop();
        Console.WriteLine("Replace: " + stopwatch.Elapsed.TotalMilliseconds + "ms");

有问题的扩展方法:

    public static string CleanNumberString(this string s)
    {
        Span<char> letters = stackalloc char[s.Length];
        int count = 0;
        for (int i = 0; i < s.Length; i++)
        {
            if (s[i] >= '0' && s[i] <= '9')
                letters[count++] = s[i];
        }
        return new string(letters.Slice(0, count));
    }

我尝试过的:

我用另一种方式运行它们。有所不同，但还不够。
使它成为一个普通的静态方法，这比扩展慢得多。由于 ref 参数稍慢，并且 in 参数与扩展方法大致相同。
积极的内联。没有任何真正的区别。我处于 Release模式，所以我怀疑编译器无论如何都会内联它。无论哪种方式，变化不大。

我还查看了内存分配，这是我所期望的。我的每次迭代只在托管堆上分配一个字符串(末尾的新字符串)，其中 Replace 为每个 Replace 分配一个新对象。所以替换一个使用的内存要高得多。但它仍然更快!

它是否调用 native C 代码并在那里做一些狡猾的事情？更高的内存使用率是否触发了 GC 并减慢了它的速度(仍然不能解释只有一两次迭代的异常快的时间)

有什么想法吗？

(是的，我知道不要费心去优化这样的事情，这让我很烦，因为我不知道为什么要这样做)

最佳答案

在做了一些基准测试之后，我认为可以安全地断言您的初始陈述是错误的，原因与您在删除的答案中提到的确切原因相同:方法的加载时间是唯一误导您的因素。

这是问题简化版的完整基准测试:

static void Main(string[] args)
{
    // Build string of n consecutive "ab"
    int n = 1000;
    Console.WriteLine("N: " + n);
    char[] c = new char[n];

    for (int i = 0; i < n; i+=2)
        c[i] = 'a';
    for (int i = 1; i < n; i += 2)
        c[i] = 'b';

    string s = new string(c);

    Stopwatch stopwatch;

    // Make sure everything is loaded
    s.CleanNumberString();
    s.Replace("a", "");
    s.UnsafeRemove();

    // Tests to remove all 'a' from the string

    // Unsafe remove
    stopwatch = Stopwatch.StartNew();

    string a1 = s.UnsafeRemove();

    stopwatch.Stop();
    Console.WriteLine("Unsafe remove:\t" + stopwatch.Elapsed.TotalMilliseconds + "ms");

    // Extension method
    stopwatch = Stopwatch.StartNew();

    string a2 = s.CleanNumberString();

    stopwatch.Stop();
    Console.WriteLine("Clean method:\t" + stopwatch.Elapsed.TotalMilliseconds + "ms");

    // String replace
    stopwatch = Stopwatch.StartNew();

    string a3 = s.Replace("a", "");

    stopwatch.Stop();
    Console.WriteLine("String.Replace:\t" + stopwatch.Elapsed.TotalMilliseconds + "ms");

    // Make sure the returned strings are identical
    Console.WriteLine(a1.Equals(a2) && a2.Equals(a3));

    Console.ReadKey();

}

public static string CleanNumberString(this string s)
{
    char[] letters = new char[s.Length];
    int count = 0;
    for (int i = 0; i < s.Length; i++)
        if (s[i] == 'b')
            letters[count++] = 'b';
    return new string(letters.SubArray(0, count));
}

public static T[] SubArray<T>(this T[] data, int index, int length)
{
    T[] result = new T[length];
    Array.Copy(data, index, result, 0, length);
    return result;
}

// Taken from https://stackoverflow.com/a/2183442/6923568
public static unsafe string UnsafeRemove(this string s)
{
    int len = s.Length;
    char* newChars = stackalloc char[len];
    char* currentChar = newChars;

    for (int i = 0; i < len; ++i)
    {
        char c = s[i];
        switch (c)
        {
            case 'a':
                continue;
            default:
                *currentChar++ = c;
                break;
        }
    }
    return new string(newChars, 0, (int)(currentChar - newChars));
}

当使用不同的 n 值运行时，很明显您的扩展方法(或者至少是我的等效版本)具有使其比 String.Replace 更快的逻辑()。事实上，它在小字符串或大字符串上的性能都更高:

N: 100
Unsafe remove: 0,0024ms
Clean method: 0,0015ms
String.Replace: 0,0021ms
True

N: 100000
Unsafe remove: 0,3889ms
Clean method: 0,5308ms
String.Replace: 1,3993ms
True

我高度怀疑 String.Replace() 中字符串的替换优化(不要与删除相比)罪魁祸首在这里。我还添加了一个来自 this answer 的方法对删除字符进行另一个比较。该时间的行为与您的方法类似，但在 n 的较高值(在我的测试中为 80k+)时变得更快。

综上所述，由于您的问题是基于我们发现错误的假设，如果您需要更多解释为什么相反是正确的(即“为什么 String.Replace() 比我的方法慢”) ，大量关于字符串操作的深入基准测试已经这样做了。

关于C# 扩展方法比链式替换慢，除非在紧密循环中。为什么？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54874650/

文章推荐： C#:HashSet的volatile读写

文章推荐： c# - .NET 核心 API : Disable multiple route expanding in SwaggerUI

文章推荐： c# - 先用点表示小数，再用逗号表示

链式-父类中返回子类对象
一晃五年没写博客了，依旧再C#上耕耘，依旧没有啥建树，现在也不知道.net上还有多少人再使用，在这里分享一些自己觉得写的还算优雅的代码。对于自己写着完的代码，我特别喜欢链式（来源于jQuer
c# - 链式 if 语句的模式
我正在构建一个吉他和弦查找应用程序。我使用多维数组来表示指板。数组中的每个元素都由具有字符串属性“Note”的 FretSpace 结构表示。为了初始化指板上的音符属性，我传递了要处理的吉他弦的详细信
Javascript 链式 promise
我在演示代码中使用 setTimeout 函数模拟了 3 个 ajax 调用。我将从一段运行良好的代码开始:所有调用都是并行进行的，我希望所有调用都能成功，否则会出现错误。 var p1 = func
python - 链式 AND 条件给出不明确的结果
谁能解释一下？ a = [2,3,4] b = [5,6,8,9] print(len(a) > 0) print(len(b) > 0) print((len(a) > 0) & len(b) >
Java 链式/嵌套方法调用
我正在处理具有多个子 JSONObject 的 JSONObject。这是我填写内容的方式: myJson.getJSONObject(CAT_NAME).put(VAR_NAME, var)
c# - 链式 IF 结构
想象一下这种情况，我有一个需要检查属性的对象。但是，该对象当前可以具有空值。如何在一个“if”条件下检查这两个条件？目前，我必须做这样的事情: if (myObject != null) {
java - 链式 Observable
我有一个对象集合，称它们为obj。他们有一个 act() 方法。 act() 方法最终会导致 o 上的 event() observable 调用 onComplete。链接这些的好方法是什么？即
python - 链式 QSortFilterProxyModel
假设我有一个列表变量 datalist 存储 10,000 个字符串实体。QTableView 只需要显示其中的一些实体。这就是为什么 QTableView 被指定为 QSortFilterProxy
wix - 链式 MSI 安装程序工具
我正在寻找支持链式 MSI 安装的工具(最好不是 InstallShield，而且最好是便宜/免费的)。我有几个小型安装需要能够单独部署，但也需要作为一个组部署，我不想维护多个安装程序。看起来我需要
c# - 链式 LINQ 语句的效率如何？
在这种情况下，我想迭代集合中除最后 2 个元素之外的所有元素。假设我采用了一种奇怪的方式，例如 x.Reverse().Skip(2).Reverse()。每个 LINQ 操作是否会有效地生成一个
javascript - 链式 html 数字选择
对于javascript来说非常陌生，我有两个html数字选择，包括年份，我想将第二个选择与第一个选择链接起来，这样当我在第一个选择中选择年份时(而第二个选择没有选项)首先)，第二个选择应包括从所选数
javascript - 链式 bluebird .then() 的奇怪执行顺序
有人可以向我解释一下为什么以下两个链式函数: // returns zero if okay var resetCounter = function (model) { return new Prom
AngularJS 链式 promise 和最终回调
所以我有 2 个 promise 函数。当第一个函数出现错误时，我希望它显示错误消息。当完成或失败时，我希望他们执行一个finally catch all 函数，但由于某种原因它不起作用。我的代码如下
javascript - 链式 promise 发挥作用
我有一个函数 const func = () => server.insertPatientSurveyQuestionToDataBase(Store.getPatientID(), SurveyN
javascript - 链式 promise 如何在微任务队列中排队
(async function() { var a,b; function flush(){ return new Promise(res => {
javascript - 链式 promise 并使用所有变量
这个问题已经有答案了: Promise chaining: Use result from previous promise in next then callback [duplicate] (1
powershell - 链式 powershell 替换命令是否一个接一个地执行？
这可能不是专业正则表达式理解的问题。唯一重要的是因为我正在运行多个链式替换命令，这些命令会影响文本文件中的某些相同文本。我还想象在替换之前，根据分隔符词(需要多次替换)的使用方式对 txt 文件进行分
python - 链式 Python 类调用
我正在尝试构建一组类来定义 OSI 堆栈中协议(protocol)的分层属性...从抽象意义上讲，我只需要从父 python 类继承属性，但我需要能够调用整个类链一次...所以，我正在寻找这样的东西.
javascript - 链式 promise 不会捕获错误
我正在努力兑现 promise ，到目前为止我偶然发现了这一点: new Promise((resolve, reject) => { setTimeout(() => { r
javascript - 链式 promise 并装饰对象
我试图理解 promise ，我需要链接它们并装饰来自不同端点的对象宽度数据。例如: 我的 Node-express 应用程序中有这个 //controller.js export const ge

太空狗

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

C# 扩展方法比链式替换慢，除非在紧密循环中。为什么？