gpt4 book ai didi

hardware - 估计PC(x86)上的过程能耗

转载 作者:行者123 更新时间:2023-12-02 18:48:12 25 4
gpt4 key购买 nike

我试图提出一种启发式方法,以估计一个进程或线程在两个时间点之间消耗了多少能量(例如,以焦耳为单位)。这是在PC(Linux / x86)上,而不是在移动设备上,因此将使用统计信息来比较耗时相似的挂钟时间的计算的相对能效。

其想法是收集或采样硬件统计信息,例如周期计数器,p / c状态或动态频率,总线访问等,并为测量之间的能源使用提出合理的公式。我要问的是这是否可能,以及该公式的外观如何。

我想到了一些挑战:
1)正确考虑上下文切换到其他进程(或线程)的情况。

2)适当考虑CPU外部使用的能量。如果我们假设I / O可以忽略不计,则主要是RAM。分配量和/或访问方式如何影响能源使用? (也就是说,假设我有一种方法来衡量动态内存分配,例如从修改后的分配器开始。)

3)使用CPU时间作为估算值​​仅限于粗粒度和经常出错的统计,仅CPU能耗,并假定时钟频率固定。它包括但不能很好地解释等待RAM所花费的时间。

最佳答案

您可能能够获得过程功耗的数字,但仅在隔离时才是正确的。例如,如果您并行运行两个流程,则不太可能以很高的精度拟合一条直线。

在每个电压轨都完全断开的嵌入式平台上,这很难做到,更不用说在PC上了,其中一个数据点是插座的功率。您需要衡量并牢记的事项:


基本负载并非如此。空闲数秒的系统将比没有空闲的系统处于更深的睡眠状态。您测量“深度”睡眠还是只是闲着?您怎么知道您要测量的是什么?
负载并不总是线性的。可变电压:某些组件根据负载和频率使电压上/下移。温度:这些天可以任意变化(不仅是热失控)。
电源在所有负载下的效率都不相同。如果要测量插座功率,则需要牢记这一点。例如,在100W以下,它可能有50%的效率,在100-300W以下时有90%的效率,而在300W +以下降低到80%。
附加过程不一定会线性增加。例如,一旦DDR处于空闲状态,其基本负载就会增加,但是其他进程不会使情况变得更糟。对于多个内核和可变频率,这甚至更加不可预测。


测量它的基本方法是显而易见的方法:记录空闲时的瓦数,记录使用中的瓦数,减去。您可以尝试以50%,25%,75%等占空比运行,以绘制漂亮的图形(线性或其他图形)。这将显示任何非线性。不幸的是,CPU稳压器和PSU的转换效率与负载的关系将是主要原因。如果没有正在使用的母板的开发版本(不太可能),或者如果您有幸拥有具有效率与负载的图表的PSU,您可以采取很多措施来消除这种情况。

但是,重要的是要意识到这些数据点仅在隔离时才是正确的。您可以很好地建模这些东西在系统中的汇总方式,但是要意识到,充其量只是一个很好的近似值。可以将其视为等同于为音频编解码器查看一些C代码并估算其运行速度。您可以得到一个很好的总体思路,但是期望在实际测量中会非常不准确。

编辑-扩展上述内容并不能真正解决您的问题。

测量功耗:给自己一个准确的功率计。如前所述,除非您有办法断开各个电压轨并测量电流,否则唯一可以进行的测量是在电源插座上。另外,如果您可以访问主板上的运行状况监视状态,并且具有当前(安培)报告(稀有),则可以提供良好的准确性和快速的响应时间。

因此,测量基础功率-选择您认为是“基础”的任何情况。运行测试,并测量“峰值”。减去,完成。是的,这很明显。如果您有一些差异很小的东西而已在噪声中损失掉了,您可以尝试测量一段时间内的能源使用量(例如kWh)。尝试在闲置状态下测量一个小时与在整个过程中运行一个小时来测量一个小时,然后查看总能量差。对要执行的所有类型的测试类似地重复。

对于大量CPU,DDR和GPU用户,您将获得明显的功率差异。您可能会注意到L1与L2与DDR约束算法之间的区别(DDR使用更多的功率),如果您要注意L1 / L2约束算法运行得更快-您需要考虑每个“任务”使用的能量没有连续的力量。除了性能受到影响外,您可能不会注意到硬盘访问(实际上只有一瓦或两瓦,并且在PC的噪音中损失了)。值得记录的一个额外数据点是,如果您有一个任务每100毫秒左右唤醒一次,则使用1%的CPU会增加多少“基本”负载。这基本上就是非深度睡眠空闲的样子。 (这是一次破解,猜测是100毫秒)

如果您启用了频率更改策略的CPU,请注意1%可能与其他时间的1%不同。

最后要注意的一件事:正如您为问题命名时一样,您当然应该测量能量。如果您忘记了一项任务相对于另一项任务的功耗,则很容易犯错误,并得出结论认为一项任务的成本更高...例如,这经常发生在不良技术记者对硬盘和SSD进行基准测试时。

在具有跨多个电源轨的电流监控功能的嵌入式平台上,我已经按照指令对测量进行了精确到纳焦的测量。仍然难以按线程/进程来计算能源使用量,因为许多任务共享许多负载,并且它可以在其时间片外增加/减少。在PC上,我不确定您是否可以做到那样精细:)

关于hardware - 估计PC(x86)上的过程能耗,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4485153/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com