gpt4 book ai didi

Lua性能优化技巧(二):基本事实

转载 作者:qq735679552 更新时间:2022-09-29 22:32:09 25 4
gpt4 key购买 nike

CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章Lua性能优化技巧(二):基本事实由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.

在运行任何代码之前,Lua都会把源代码翻译(预编译)成一种内部的格式。这种格式是一个虚拟机指令序列,与真实的CPU所执行的机器码类似。之后,这个内部格式将会被由一个包含巨大的switch结构的while循环组成的C代码解释执行,switch中的每个case对应一条指令.

可能你已经在别处了解到,从5.0版开始,Lua使用一种基于寄存器的虚拟机。这里所说的虚拟机“寄存器”与真正的CPU寄存器并不相同,因为后者难于移植,而且数量非常有限。Lua使用一个栈(通过一个数组和若干索引来实现)来提供寄存器。每个活动的函数都有一个激活记录,也就是栈上的一个可供该函数存储寄存器的片段。因此,每个函数都有自己的寄存器[1]。一个函数可以使用最多250个寄存器,因为每个指令只有8位用于引用一个寄存器.

由于寄存器数目众多,因此Lua预编译器可以把所有的局部变量都保存在寄存器里。这样带来的好处是,访问局部变量会非常快。例如,如果a和b是局部变量,语句 。

复制代码 代码如下:

a = a + b

将只会生成一个指令:

复制代码 代码如下:

ADD 0 0 1

(假设a和b在寄存器里分别对应0和1)。作为对比,如果a和b都是全局变量,那么这段代码将会变成:

复制代码 代码如下:

GETGLOBAL 0 0 ; a
GETGLOBAL 1 1 ; b
ADD 0 0 1
SETGLOBAL 0 0 ; a

因此,可以很简单地得出在Lua编程时最重要的性能优化方式:使用局部变量! 。

  。

如果你想压榨程序的性能,有很多地方都可以使用这个方法。例如,如果你要在一个很长的循环里调用一个函数,可以预先将这个函数赋值给一个局部变量。比如说如下代码:

复制代码 代码如下:

for i = 1, 1000000 do
    local x = math.sin(i)
end

比下面这段要慢30%:

复制代码 代码如下:

local sin = math.sin
for i = 1, 1000000 do
    local x = sin(i)
end

访问外部局部变量(或者说,函数的上值)没有直接访问局部变量那么快,但依然比访问全局变量要快一些。例如下面的代码片段:

  。

  。

复制代码 代码如下:

function foo (x)     for i = 1, 1000000 do         x = x + math.sin(i)     end     return x end 。

  。

print(foo(10)) 。

可以优化为在foo外声明一次sin:

  。

  。

复制代码 代码如下:

local sin = math.sin function foo (x)     for i = 1, 1000000 do         x = x + sin(i)     end     return x end 。

  。

print(foo(10)) 。

第二段代码比前者要快30%.

  。

尽管比起其他语言的编译器来说,Lua的编译器非常高效,但是编译依然是重体力活。因此,应该尽可能避免运行时的编译(例如使用loadstring函数),除非你真的需要有如此动态要求的代码,例如由用户输入的代码。只有很少的情况下才需要动态编译代码.

例如,下面的代码创建一个包含返回常数值1到100000的若干个函数的表:

  。

复制代码 代码如下:

local lim = 10000 local a = {} for i = 1, lim do     a[i] = loadstring(string.format("return %d", i)) end 。

  。

print(a[10]()) --> 10 。

执行这段代码需要1.4秒.

  。

通过使用闭包,我们可以避免使用动态编译。下面的代码只需要十分之一的时间完成相同的工作:

复制代码 代码如下:

function fk (k)     return function () return k end end 。

  。

local lim = 100000 local a = {} for i = 1, lim do a[i] = fk(i) end 。

print(a[10]()) --> 10 。

  。

最后此篇关于Lua性能优化技巧(二):基本事实的文章就讲到这里了,如果你想了解更多关于Lua性能优化技巧(二):基本事实的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com