- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
当我尝试优化我的代码时,很长一段时间我一直在使用一个经验法则,即加法和减法值 1,乘法和除法值 3,平方值 3(我很少使用更通用的 pow
函数,所以我没有经验法则),平方根值 10。(我假设平方只是乘法,所以值 3。)
这是 2D 轨道模拟的示例。为了计算和应用重力加速度,首先我得到从船到地心的距离,然后计算加速度。
D = sqrt( sqr(Ship.x - Earth.x) + sqr(Ship.y - Earth.y) ); // this is worth 19
A = G*Earth.mass/sqr(D); // this is worth 9, total is 28
A = G*Earth.mass/( sqr(Ship.x - Earth.x) + sqr(Ship.y - Earth.y) ); // this is worth 15
最佳答案
至少,人们必须了解一项操作至少有两个有趣的时间点:延迟和吞吐量。
潜伏
延迟是任何特定操作从输入到输出所需的时间。如果您有一系列操作,其中一个操作的输出被馈送到下一个操作的输入,则延迟将决定总时间。例如,最新的 x86 硬件上的整数乘法有 3 个周期的延迟:完成一个乘法运算需要 3 个周期。整数加法有 1 个周期的延迟:结果在加法执行后的周期可用。延迟通常是正整数。
吞吐量
吞吐量是单位时间内可以执行的独立操作的数量。由于 CPU 是流水线和超标量的,这通常不仅仅是延迟的倒数。例如,在最新的 x86 芯片上,即使延迟为 1 个周期,每个周期也可以执行 4 个整数加法运算。类似地,平均每个周期可以执行 1 个整数乘法,即使任何特定的乘法需要 3 个周期才能完成(这意味着您必须同时进行多个独立的乘法才能实现这一点)。
逆吞吐量
在讨论指令性能时,通常将吞吐量数字表示为“逆吞吐量”,即 1 / throughput
.这使您可以轻松地直接与延迟数据进行比较,而无需在脑海中进行划分。例如,加法的逆吞吐量为 0.25 个周期,而延迟为 1 个周期,因此您可以立即看到,如果您有足够多的独立加法,它们每个只使用 0.25 个周期。
下面我将使用逆吞吐量。
可变时间
大多数简单的指令都有固定的时间,至少在它们的 reg-reg 形式中。然而,一些更复杂的数学运算可能具有依赖于输入的时序。例如,加法、减法和乘法通常在整数和浮点形式上有固定的时序,但在许多平台上,除法在整数、浮点或两者上都有可变的时序。 Agner 的数字通常会显示一个范围来表示这一点,但您不应假设操作数空间已经过广泛测试,尤其是对于浮点数。
例如,下面的 Skylake 数字显示的范围很小,但不清楚这是由于操作数依赖性(可能会更大)还是其他原因。
根据非正规模式,传递非正规输入或本身非正规的结果可能会产生显着的额外成本。您将在指南中看到的数字通常假定没有异常值,但您可以在别处找到有关每次操作的异常成本的讨论。
更多细节
以上信息对于完全限定性能而言是必要的,但通常不是足够的信息,因为您还有其他因素需要考虑,例如执行端口争用、前端瓶颈等。不过,开始就足够了,如果我理解正确,您只是要求“经验法则”数字。
阿格纳雾
我推荐的测量延迟和逆吞吐量数字的来源是 Agner's Fogs guides .您想要 下的文件4. 指令表:Intel、AMD 和VIA CPU 的指令延迟、吞吐量和微操作故障列表 ,其中列出了各种 AMD 和 Intel CPU 上相当详尽的时序。您也可以直接从 Intel 的指南中获取某些 CPU 的编号,但我发现它们不如 Agner 的指南完整且更难使用。
下面我将列出几个现代 CPU 的数字,用于您感兴趣的基本操作。
英特尔天湖
Lat Inv Tpt
add/sub (addsd, subsd) 4 0.5
multiply (mulsd) 4 0.5
divide (divsd) 13-14 4
sqrt (sqrtpd) 15-16 4-6
Lat Inv Tpt
add/sub (addsd, subsd) 3 0.5
multiply (mulsd) 4 0.5
divide (divsd) 8-13 4-5
sqrt (sqrtpd) 14-15 4-8
关于performance - 6 种基本算术运算的相对循环时间是多少?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46505827/
我是 PHP 新手。我一直在脚本中使用 for 循环、while 循环、foreach 循环。我想知道 哪个性能更好? 选择循环的标准是什么? 当我们在另一个循环中循环时应该使用哪个? 我一直想知道要
我在高中的编程课上,我的作业是制作一个基本的小计和顶级计算器,但我在一家餐馆工作,所以制作一个只能让你在一种食物中读到。因此,我尝试让它能够接收多种食品并将它们添加到一个价格变量中。抱歉,如果某些代码
这是我正在学习的一本教科书。 var ingredients = ["eggs", "milk", "flour", "sugar", "baking soda", "baking powder",
我正在从字符串中提取数字并将其传递给函数。我想给它加 1,然后返回字符串,同时保留前导零。我可以使用 while 循环来完成此操作,但不能使用 for 循环。 for 循环只是跳过零。 var add
编辑:我已经在程序的输出中进行了编辑。 该程序要求估计给定值 mu。用户给出一个值 mu,同时还提供了四个不等于 1 的不同数字(称为 w、x、y、z)。然后,程序尝试使用 de Jaeger 公式找
我正在编写一个算法,该算法对一个整数数组从末尾到开头执行一个大循环,其中包含一个 if 条件。第一次条件为假时,循环可以终止。 因此,对于 for 循环,如果条件为假,它会继续迭代并进行简单的变量更改
现在我已经习惯了在内存非常有限的情况下进行编程,但我没有答案的一个问题是:哪个内存效率更高;- for(;;) 或 while() ?还是它们可以平等互换?如果有的话,还要对效率问题发表评论! 最佳答
这个问题已经有答案了: How do I compare strings in Java? (23 个回答) 已关闭 8 年前。 我正在尝试创建一个小程序,我可以在其中读取该程序的单词。如果单词有 6
这个问题在这里已经有了答案: python : list index out of range error while iteratively popping elements (12 个答案) 关
我正在尝试向用户请求 4 到 10 之间的整数。如果他们回答超出该范围,它将进入循环。当用户第一次正确输入数字时,它不会中断并继续执行 else 语句。如果用户在 else 语句中正确输入数字,它将正
我尝试创建一个带有嵌套 foreach 循环的列表。第一个循环是循环一些数字,第二个循环是循环日期。我想给一个日期写一个数字。所以还有另一个功能来检查它。但结果是数字多次写入日期。 Out 是这样的:
我想要做的事情是使用循环创建一个数组,然后在另一个类中调用该数组,这不会做,也可能永远不会做。解决这个问题最好的方法是什么?我已经寻找了所有解决方案,但它们无法编译。感谢您的帮助。 import ja
我尝试创建一个带有嵌套 foreach 循环的列表。第一个循环是循环一些数字,第二个循环是循环日期。我想给一个日期写一个数字。所以还有另一个功能来检查它。但结果是数字多次写入日期。 Out 是这样的:
我正在模拟一家快餐店三个多小时。这三个小时分为 18 个间隔,每个间隔 600 秒。每个间隔都会输出有关这 600 秒内发生的情况的统计信息。 我原来的结构是这样的: int i; for (i=0;
这个问题已经有答案了: IE8 for...in enumerator (3 个回答) How do I check if an object has a specific property in J
哪个对性能更好?这可能与其他编程语言不一致,所以如果它们不同,或者如果你能用你对特定语言的知识回答我的问题,请解释。 我将使用 c++ 作为示例,但我想知道它在 java、c 或任何其他主流语言中的工
这个问题不太可能帮助任何 future 的访问者;它只与一个小的地理区域、一个特定的时间点或一个非常狭窄的情况有关,这些情况并不普遍适用于互联网的全局受众。为了帮助使这个问题更广泛地适用,visit
我是 C 编程和编写代码的新手,以确定 M 测试用例的质因数分解。如果我一次只扫描一次,该功能本身就可以工作,但是当我尝试执行 M 次时却惨遭失败。 我不知道为什么 scanf() 循环有问题。 in
这个问题已经有答案了: JavaScript by reference vs. by value [duplicate] (4 个回答) 已关闭 3 年前。 我在使用 TSlint 时遇到问题,并且理
我尝试在下面的代码中添加 foreach 或 for 循环,以便为 Charts.js 创建多个数据集。这将允许我在此折线图上创建多条线。 我有一个 PHP 对象,我可以对其进行编码以稍后填充变量,但
我是一名优秀的程序员,十分优秀!