xna - HLSL 像素着色器光照性能 (XNA)-6ren

xna - HLSL 像素着色器光照性能 (XNA)

转载作者：行者123 更新时间：2023-12-04 05:07:58

29

4

我有一个足够简单的着色器，它支持多个点光源。
灯光存储为一组灯光结构(最大大小)，当事件灯光发生变化时，我会传入事件灯光的数量。
问题出在 PixelShader 函数中:
这是基本的东西，从纹理中获取基色，遍历 0 到 numActiveLights 的灯光数组并添加效果，它工作正常，但性能很糟糕!
但是，如果我用相同值的常量替换对全局 var numActiveLights 的引用，则性能很好。
我只是无法理解为什么引用变量会产生 30+ fps 的差异。

谁能解释一下？

完整着色器代码:

#define MAX_POINT_LIGHTS 16

struct PointLight
{
    float3      Position;
    float4      Color;
    float       Radius;
};

float4x4    World;
float4x4    View;
float4x4    Projection;
float3  CameraPosition;

float4  SpecularColor;
float   SpecularPower;
float   SpecularIntensity;
float4      AmbientColor;
float   AmbientIntensity;
float   DiffuseIntensity;   

int     activeLights;
PointLight  lights[MAX_POINT_LIGHTS];

bool    IsLightingEnabled;
bool    IsAmbientLightingEnabled;
bool    IsDiffuseLightingEnabled;
bool    IsSpecularLightingEnabled;


Texture Texture;
sampler TextureSampler = sampler_state
{
    Texture = <Texture>;

    Magfilter = POINT;
    Minfilter = POINT;
    Mipfilter = POINT;

    AddressU = WRAP;
    AddressV = WRAP;
};

struct VS_INPUT
{
    float4 Position : POSITION0;
    float2 TexCoord : TEXCOORD0;
    float3 Normal : NORMAL0;
};

struct VS_OUTPUT
{
    float3 WorldPosition : TEXCOORD0;
    float4 Position : POSITION0;
    float3 Normal : TEXCOORD1;
    float2 TexCoord : TEXCOORD2;
    float3 ViewDir : TEXCOORD3;

};

VS_OUTPUT VS_PointLighting(VS_INPUT input)
{
    VS_OUTPUT output;

    float4 worldPosition = mul(input.Position, World);
    output.WorldPosition = worldPosition;

    float4 viewPosition = mul(worldPosition, View);
    output.Position = mul(viewPosition, Projection);

    output.Normal = normalize(mul(input.Normal, World));
    output.TexCoord = input.TexCoord;
    output.ViewDir = normalize(CameraPosition -  worldPosition);

    return output;
}

float4 PS_PointLighting(VS_OUTPUT IN) : COLOR
{
    if(!IsLightingEnabled) return tex2D(TextureSampler,IN.TexCoord);

    float4 color = float4(0.0f, 0.0f, 0.0f, 0.0f);

    float3 n = normalize(IN.Normal);
    float3 v = normalize(IN.ViewDir);
    float3 l = float3(0.0f, 0.0f, 0.0f);
    float3 h = float3(0.0f, 0.0f, 0.0f);

    float atten = 0.0f;
    float nDotL = 0.0f;
    float power = 0.0f;

    if(IsAmbientLightingEnabled) color += (AmbientColor*AmbientIntensity);

    if(IsDiffuseLightingEnabled || IsSpecularLightingEnabled)
    {
        //for (int i = 0; i < activeLights; ++i)//works but perfoemnce is terrible
        for (int i = 0; i < 7; ++i)//performance is fine but obviously isn't dynamic
        {
            l = (lights[i].Position - IN.WorldPosition) / lights[i].Radius;
            atten = saturate(1.0f - dot(l, l));

            l = normalize(l);

            nDotL = saturate(dot(n, l));

            if(IsDiffuseLightingEnabled) color += (lights[i].Color * nDotL * atten);
            if(IsSpecularLightingEnabled) color += (SpecularColor * SpecularPower * atten);
        }
    }

    return color * tex2D(TextureSampler, IN.TexCoord);
}

technique PerPixelPointLighting
{
    pass
    {
        VertexShader = compile vs_3_0 VS_PointLighting();
        PixelShader = compile ps_3_0 PS_PointLighting();
    }
}

最佳答案

我的猜测是将循环约束更改为编译时常量允许 HLSL 编译器展开循环。也就是说，而不是这样:

for (int i = 0; i < 7; i++)
    doLoopyStuff();

变成这样了:

doLoopyStuff();
doLoopyStuff();
doLoopyStuff();
doLoopyStuff();
doLoopyStuff();
doLoopyStuff();
doLoopyStuff();

循环和条件分支可能会严重影响着色器代码的性能，应尽可能避免。

编辑

这只是我的头顶，但也许你可以尝试这样的事情？

for (int i = 0; i < MAX_LIGHTS; i++)
{
    color += step(i, activeLights) * lightingFunction();
}

通过这种方式，您可以计算所有可能的灯光，但对于不事件的灯光始终获得 0 值。当然，好处将取决于照明功能的复杂性；你需要做更多的分析。

关于xna - HLSL 像素着色器光照性能 (XNA)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/15277843/

29

4

0

文章推荐：我可以计算 double 引入的误差吗？

文章推荐： web-services - 使用 Perl 构建 Web 服务

文章推荐： sql - 如何在SQL Server中获取行的行ID

xna - 将内容项目 (XNA) 链接到非 XNA 项目
我可以将内容项目引用到非 XNA 项目(MonoGame，如果它很重要)？最佳答案不直接。将内容项目引用添加到项目的功能仅适用于“XNA 游戏”和“XNA 游戏库”类型的项目。当我想在 Win
xna - XNA 中非常简单的菜单
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。想改善这个问题吗？更新问题，使其成为 on-topic对于堆栈溢出。 4年前关闭。 Improve thi
xna - xna 中的大型多人游戏
您如何看待 xna 和大型多人游戏？例如服务器和 100 个客户端？有没有很好的教程如何在 xna 中创建客户端服务器应用程序？最佳答案当然有关于如何做到这一点的教程。我个人使用 Lidgren
xna - XNA 中的随机纹理
好的，所以我正在开发这个游戏，我是 XNA 的新手(我使用的是 4.0)，我想做的是每次产生敌人时都有不同的纹理。所以我有这些图像“image1.png”、“image2.png”等等。我希望它在每
xna - XNA-在游戏中看不到鼠标
我最近开始检查XNA。一切进展顺利，我什至开始了一个工作样本。困扰我的一件事是，每当我将鼠标放在游戏窗口上时，它就会消失。我不知道这是否是默认行为，但我想更改此设置以便可以看到鼠标。任何和所有建议，不
xna - XNA 中的这种旋转行为是什么？
我刚从 XNA 开始，有一个关于轮换的问题。当你在 XNA 中将一个向量乘以一个旋转矩阵时，它会逆时针旋转。这个我明白。但是，让我举一个我不明白的例子。假设我将一个随机艺术 Assets 加载到管道
xna - 在哪里可以找到要下载的最新版本的 XNA？
我正在使用 Visual Studio 2010 Ultimate，在谷歌上搜索 XNA 下载后，我找到了这个页面: http://blogs.msdn.com/b/xna/archive/2010/
xna - XNA SoundEffect无法从文件加载
我有一个字典来存储SoundEffects，例如: public static Dictionary Hangok = new Dictionary(); 我从文件(正常.wav格式)加载声音，例如:
xna - 学习 XNA 3.1 与 XNA 4.0
关闭。这个问题是off-topic .它目前不接受答案。想改善这个问题吗？ Update the question所以它是 on-topic对于堆栈溢出。 10年前关闭。 Improve this
xna - 在 XNA 中计算重力
好吧，我正在尝试为 3D XNA 游戏创建自己的物理引擎，但我在计算我应该将物体移动多少时遇到重力问题。 XNA 的游戏计时器每 16 毫秒出现一次，所以经过一些计算，并使用 9.81m/s 作为我的
xna - 使用CPU而非GPU(XNA)绘制粒子
我正在尝试对以下粒子系统进行修改。 http://create.msdn.com/en-US/education/catalog/sample/particle_3d 我有一个功能，当我按下Space
xna - 什么是学习 XNA 的好资源？
As it currently stands, this question is not a good fit for our Q&A format. We expect answers to be
xna - 使用旋转卡尺在 XNA 中找到凸包的定向边界框
也许这更像是一个数学问题而不是一个编程问题，但我一直在尝试在 XNA 中实现旋转卡尺算法。我已经使用维基百科上详述的单调链从我的点集中推导出了一个凸包。现在，我正在尝试对我的算法进行建模，以在此处
xna - 在 XNA 游戏中在哪里保存高分？
我正在 XNA 中制作一个简单的 2 人游戏，并开始研究保存玩家的高分。我希望游戏能在 XBox 360 和 Windows 上运行，所以我必须使用框架来保存数据。您似乎将数据保存到特定用户的玩家
xna - 什么是最好的 XNA 博客？
就目前而言，这个问题不适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the
xna - 如何在 XNA 游戏中更改字体大小？
我需要使用不同字体大小的 spritefont，我必须为每个大小创建新的 spritefont 吗？最佳答案基本上是的。有一个overload的 SpriteBatch.DrawString这为
xna - 我应该把我的自定义关卡文件夹放在 XNA 游戏中的什么位置？
我对在我的游戏中存储 *.txt 级别文件的位置和方式感到非常困惑。我想要在我的游戏中提供一些随游戏一起安装的“预烘焙”关卡的可用性，以及用户创建自己的关卡的能力。所以我所做的是在 Visual
xna - HLSL 像素着色器光照性能 (XNA)
我有一个足够简单的着色器，它支持多个点光源。灯光存储为一组灯光结构(最大大小)，当事件灯光发生变化时，我会传入事件灯光的数量。问题出在 PixelShader 函数中: 这是基本的东西，从纹理中获
xna - 如何在 xna 游戏中制作差异图像动画？
我有 19 张图像，它们是我的播放器的动画帧在下面，我创建了 Frog 纹理数组，这是我的播放器。并且有 19 个图像。如何对它们进行动画处理。公共(public)类纹理 { 公共(public)
xna - 在 XNA 中正确获取聊天键
所以，我要直截了本地说，我正在尝试在我正在制作的 XNA 游戏中制作一个聊天系统。我可以很容易地找出正在按下的键但是我无法知道实际键入的是什么。在我看来，他们好像在说:OemShifthello bi

首页

博学

6Ren·AI

商城

xna - HLSL 像素着色器光照性能 (XNA)