- r - 以节省内存的方式增长 data.frame
- ruby-on-rails - ruby/ruby on rails 内存泄漏检测
- android - 无法解析导入android.support.v7.app
- UNIX 域套接字与共享内存(映射文件)
我对 stackalloc
运算符的功能有一些疑问。
它实际上是如何分配的?我认为它会做类似的事情:
void* stackalloc(int sizeInBytes)
{
void* p = StackPointer (esp);
StackPointer += sizeInBytes;
if(StackPointer exceeds stack size)
throw new StackOverflowException(...);
return p;
}
但我已经做了一些测试,但我不确定它是如何工作的。我们无法确切知道它的作用以及它是如何做到的,但我想了解基础知识。
我认为堆栈分配(嗯,实际上我确定)比堆分配更快。那么为什么这个例子:
class Program
{
static void Main(string[] args)
{
Stopwatch sw1 = new Stopwatch();
sw1.Start();
StackAllocation();
Console.WriteLine(sw1.ElapsedTicks);
Stopwatch sw2 = new Stopwatch();
sw2.Start();
HeapAllocation();
Console.WriteLine(sw2.ElapsedTicks);
}
static unsafe void StackAllocation()
{
for (int i = 0; i < 100; i++)
{
int* p = stackalloc int[100];
}
}
static void HeapAllocation()
{
for (int i = 0; i < 100; i++)
{
int[] a = new int[100];
}
}
}
给出280~ 堆栈分配滴答 的平均结果,通常1-0 滴答堆分配?(在我的个人计算机上,Intel Core i7)。
在我现在使用的计算机(Intel Core 2 Duo)上,结果比以前的更有意义(可能是因为 Optimize code 没有在 VS 中检查): 堆栈分配 460~ ticks,堆分配大约 380 ticks。
但这仍然没有意义。为什么会这样?我猜 CLR 注意到我们没有使用数组,所以它可能甚至没有分配它?
最佳答案
stackalloc 更快的情况:
private static volatile int _dummy; // just to avoid any optimisations
// that have us measuring the wrong
// thing. Especially since the difference
// is more noticable in a release build
// (also more noticable on a multi-core
// machine than single- or dual-core).
static void Main(string[] args)
{
System.Diagnostics.Stopwatch sw1 = new System.Diagnostics.Stopwatch();
Thread[] threads = new Thread[20];
sw1.Start();
for(int t = 0; t != 20; ++t)
{
threads[t] = new Thread(DoSA);
threads[t].Start();
}
for(int t = 0; t != 20; ++t)
threads[t].Join();
Console.WriteLine(sw1.ElapsedTicks);
System.Diagnostics.Stopwatch sw2 = new System.Diagnostics.Stopwatch();
threads = new Thread[20];
sw2.Start();
for(int t = 0; t != 20; ++t)
{
threads[t] = new Thread(DoHA);
threads[t].Start();
}
for(int t = 0; t != 20; ++t)
threads[t].Join();
Console.WriteLine(sw2.ElapsedTicks);
Console.Read();
}
private static void DoSA()
{
Random rnd = new Random(1);
for(int i = 0; i != 100000; ++i)
StackAllocation(rnd);
}
static unsafe void StackAllocation(Random rnd)
{
int size = rnd.Next(1024, 131072);
int* p = stackalloc int[size];
_dummy = *(p + rnd.Next(0, size));
}
private static void DoHA()
{
Random rnd = new Random(1);
for(int i = 0; i != 100000; ++i)
HeapAllocation(rnd);
}
static void HeapAllocation(Random rnd)
{
int size = rnd.Next(1024, 131072);
int[] a = new int[size];
_dummy = a[rnd.Next(0, size)];
}
此代码与问题中的代码之间的重要区别:
我们有几个线程在运行。通过堆栈分配,他们在自己的堆栈中进行分配。通过堆分配,它们从与其他线程共享的堆中进行分配。
分配更大的尺寸。
每次分配不同的大小(尽管我为随机生成器设置了种子以使测试更具确定性)。这使得堆碎片更有可能发生,从而使堆分配的效率低于每次相同的分配。
除此之外,还值得注意的是 stackalloc
通常会用作使用 fixed
的替代方法将数组固定在堆上。固定数组不利于堆性能(不仅对于该代码,而且对于使用同一堆的其他线程也是如此),因此如果声明的内存在任何合理的时间内使用,那么性能影响会更大。
虽然我的代码演示了 stackalloc
的情况提供了性能优势,在问题中可能更接近于大多数情况,在大多数情况下,有人可能会急切地通过使用它来“优化”。希望这两段代码一起显示整个 stackalloc
可以提升性能,但也会严重损害性能。
一般来说,你甚至不应该考虑 stackalloc
除非您无论如何都需要使用固定内存与非托管代码进行交互,否则应将其视为 fixed
的替代方案。而不是一般堆分配的替代方案。在这种情况下使用仍然需要谨慎,开始前要深思熟虑,完成后进行分析。
在其他情况下使用可能会带来好处,但它应该远远低于您要尝试的性能改进列表。
编辑:
回答问题的第 1 部分。 Stackalloc 在概念上与您描述的差不多。它获得堆栈内存的一 block ,然后返回指向该 block 的指针。它不会检查内存是否适合这样,而是如果它试图将内存获取到堆栈的末尾 - 这在线程创建时受 .NET 保护 - 那么这将导致操作系统向运行时返回异常,然后它变成 .NET 托管异常。如果您只是在具有无限递归的方法中分配一个字节,就会发生同样的情况——除非对调用进行优化以避免堆栈分配(有时可能),否则一个字节最终加起来足以触发堆栈溢出异常。
关于C# 和.NET : stackalloc,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8472655/
下面的“修复”让我很困惑;这里的场景是根据大小有条件地决定是使用堆栈还是租用缓冲区 - 这是一个非常利基但有时必要的优化,但是:使用“明显”的实现(数字 3,推迟明确的分配,直到我们真正想要分配它),
继续我的 F# 性能测试。有关更多背景信息,请参见此处: f# NativePtr.stackalloc in Struct Constructor F# NativePtr.stackalloc U
我正在玩 stackalloc并在它的返回类型中发现了很多奇怪之处。以下是使用 stackalloc 的一些示例: 1. 隐式输入返回 float* : var a = stackalloc floa
我从一篇较早的 StackOverflow 帖子中读到了一个关于何时使用 stackalloc 的示例。现在这个例子让我有点困惑: public unsafe void DoSomeStuff() {
在下面的代码中: unsafe { int m = 10; int n = 10; double*[] a = new double*[m]; for (int i =
有没有人在用 C# 编程时实际使用过 stackalloc?我知道它的作用,但它唯一一次出现在我的代码中是偶然的,因为 Intellisense 在我开始输入 static 时提示它,例如。 虽然它与
我正在用 C# 编写一些不安全的代码(跟进 this question )并且我想知道,为什么 stackalloc 确实如此关键字必须用作变量初始值设定项?例如这将产生语法错误: public un
我最近在用 C# 编写一些不安全的代码并注意到这会产生语法错误: public unsafe class UnsafeByteStream { public UnsafeByteStream(
以下代码用非零值初始化两个 stackalloc 数组。虽然数组 A 已正确初始化,但数组 B 仍填充零,这与预期相反。 通过反汇编编译后的可执行文件,可以看到没有为数组B生成初始化代码,这是为什么?
我发现了一个博客条目,它暗示有时 c# 编译器可能会决定将数组放在堆栈而不是堆上: Improving Performance Through Stack Allocation (.NET Memor
知道为什么“stackalloc”关键字接受可变长度吗? 如果这条指令返回一个指向分配在堆栈帧中的缓冲区的指针,编译器如何管理它?每次调用它来组织堆栈框架时,它都会在运行时重新编译该函数? 谢谢。 最
如果 stackalloc 与引用类型一起使用,如下所示 var arr = stackalloc string[100]; 有错误 Cannot take the address of, get t
如果我在 C# 中使用 stackalloc 分配内存,内存是否已初始化(使用 0)? 文档没有提到这一点,只说明保留了正确的金额。 在我的测试中,此类内存默认为 0,但这并不意味着它是有保证的。 最
我对 stackalloc 运算符的功能有一些疑问。 它实际上是如何分配的?我认为它会做类似的事情: void* stackalloc(int sizeInBytes) { void* p =
我试图在X64中的DelphiXE7中使用Graphics32中的StackAlloc,但是它因错误而崩溃。我尝试将 NOFRAME 添加到代码中,但这也没有帮助。 第一次机会异常(exception
我正在进行一些 F# 性能测试,并尝试在堆栈而不是堆上创建数组(值与引用类型)。我正在使用 NativePtr.stackalloc 在堆栈上分配内存。在下面的第一个构造函数中出现错误。 type S
是否有一个用 C 实现的 stackalloc 函数,允许您在堆栈上分配一个可变长度的数组,如 stackalloc in C# ? 最佳答案 有 alloca 但它不是标准的。此外,自 C99 以来
就我而言,以下代码将在堆栈上创建一个数组: unsafe struct Foo { public fixed int bar[10]; } var foo = new Foo(); stacka
我刚刚发现 C# 的 stackalloc 符号有一个令人难以置信的怪癖,请看下面的代码: // int *p; // p = stackalloc int[42]
stackalloc 关键字提供什么功能?我何时以及为什么要使用它? 最佳答案 来自 MSDN : Used in an unsafe code context to allocate a block
我是一名优秀的程序员,十分优秀!