- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我的第一篇文章在这里。一个很棒的网站和资源。
我确实进行了一些搜索,并查看了标题相似的问题,但找不到具体的内容。
我正在尝试从我的 C++ 程序使用的 C 天文计算库中删除任何冗余和膨胀。我运行了一个简单的分析器 (VerySleepy)。
这是分析器显示的使用时间最多的代码(除了 C 库函数 sprintf 等):
double swi_echeb(const double x, const double* const coef, const int ncf)
{
int j = ncf - 1;
double x2, br, brp2, brpp;
x2 = x * 2.;
br = 0.;
brp2 = 0.; /* dummy assign to silence gcc warning */
brpp = 0.;
for (; j >= 0; --j) { // <-- 0.39s
brp2 = brpp; // <-- 0.01s
brpp = br; // <-- 0.32s
br = x2 * brpp - brp2 + coef[j]; // <-- 3.49s ***
} // <-- 0.14s
return (br - brp2) * .5; // <-- 0.06s
} // <-- 0.05s
这个特定的函数深深地嵌入到其他函数中,我的程序调用的主要“启动”函数被调用了数千次。
您可以看到 3.49 秒的出色语句比所有其他语句时间高得多。我知道有一些方法可以通过在可能的情况下使用乘法来加速 C 算术。但我知道的不多。
喜欢:
将此语句拆分成更小的部分会更好吗?:
br = x2 * brpp;
br -= brp2;
br += 系数[j];
任何其他想法或批评。这段代码不是我写的,尽管我确实将 const 添加到函数参数中,因为我喜欢 const 的正确性。
我以前从未尝试过使用寄存器或其他花哨的技巧来加快速度。有人认为类似的东西可以在这里工作吗?
我知道人们会说,“试试吧!”所以我会的,如果它能帮助任何有类似算术问题的人,我会更新我得到的。
编辑:发布我根据建议测试的结果
按照从最快到最慢的顺序,这是我目前所发现的。 Profiler 是 VerySleepy。编译器是 Visual Studio 2008 Pro Ed。库和我的应用程序的编译选项是:
调试,C7格式,/O2/Ob2/Oi/Ot/Oy/GT/GL/GF/FD/MTd/GS-/Gy/fp:fast/FAs
以下是安德鲁关于“每个循环 4 次迭代”的建议。这是迄今为止最快的。
函数花费的总时间(函数中其他语句的时间未在此处显示)= 2.08 秒
for (; index >= 3; index -= 4) { // 0.02s
brp2 = brpp;
brpp = br; // 0.02s
br = x2 * brpp - brp2 + coef[index]; // 0.25s
brp2 = brpp;
brpp = br; // 0.13s
br = x2 * brpp - brp2 + coef[index - 1]; // 0.33s
brp2 = brpp;
brpp = br; // 0.13s
br = x2 * brpp - brp2 + coef[index - 2]; // 0.34s
brp2 = brpp;
brpp = br; // 0.14s
br = x2 * brpp - brp2 + coef[index - 3]; // 0.42s
}
for (; index >= 0; --index) { // 0.03s
brp2 = brpp; // 0.03s
brpp = br;
br = x2 * brpp - brp2 + coef[index]; // 0.11s
}
下一个最快的是原始的未更改代码,函数内的总时间为 2.39 秒,同样包括循环外的语句。请注意,这比我原来的帖子要少。我原来的帖子是未优化的代码,但由于每个人都建议这样做,所以我的所有测试随后都尽可能地在 VS08 中进行了优化:
for (j = ncf - 1; j >= 0; j--) { // 0.02s
brp2 = brpp; // 0.03s
brpp = br; // 0.07s
br = x2 * brpp - brp2 + coef[j]; // 2.14s
}
在这个原始代码之后,下一个最快的是德鲁预先设置指针并使用它的想法。 在函数内花费的总时间为 2.49 秒,包括循环外语句的时间:
for (; index >= coef; --index) { // 0.01s
brp2 = brpp;
brpp = br; // 0.06s
br = x2 * brpp - brp2 + *index; // 2.24s
}
我还尝试了混合使用 Andrew 的循环展开和 Drew 的指针使用,但这花费了 2.39 秒,与未更改的代码相同。
根据结果,循环展开是目前我使用的方法。
最佳答案
这似乎是缓存问题,而不是算术问题。
for (; j >= 0; --j) {
...
... coef[j];
}
您在这里访问一个数组,并且您正在递减一个索引来这样做。此操作确实会破坏简单循环中固有的缓存友好局部性。
可以往前数吗?即,
for (int i = 0; i <= j; i++) {
...
... coef[i];
}
你的计算是否有效?
关于C - 有一个简单的循环来进行算术计算;探查器显示这是一个瓶颈。如何加快速度?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8690120/
我之前让 dll 注入(inject)器变得简单,但我有 Windows 7,我用 C# 和 C++ 做了它,它工作得很好!但是现在当我在 Windows 8 中尝试相同的代码时,它似乎没有以正确的方
我正在尝试制作一个名为 core-splitter 的元素,该元素在 1.0 中已弃用,因为它在我们的项目中起着关键作用。 如果您不知道 core-splitter 的作用,我可以提供一个简短的描述。
我有几个不同的蜘蛛,想一次运行所有它们。基于 this和 this ,我可以在同一个进程中运行多个蜘蛛。但是,我不知道如何设计一个信号系统来在所有蜘蛛都完成后停止 react 器。 我试过了: cra
有没有办法在达到特定条件时停止扭曲 react 器。例如,如果一个变量被设置为某个值,那么 react 器应该停止吗? 最佳答案 理想情况下,您不会将变量设置为一个值并停止 react 器,而是调用
https://code.angularjs.org/1.0.0rc9/angular-1.0.0rc9.js 上面的链接定义了外部js文件,我不知道Angular-1.0.0rc9.js的注入(in
我正在尝试运行一个函数并将服务注入(inject)其中。我认为这可以使用 $injector 轻松完成.所以我尝试了以下(简化示例): angular.injector().invoke( [ "$q
在 google Guice 中,我可以使用函数 createInjector 创建基于多个模块的注入(inject)器。 因为我使用 GWT.create 在 GoogleGin 中实例化注入(in
我在 ASP.NET Core 1.1 解决方案中使用配置绑定(bind)。基本上,我在“ConfigureServices Startup”部分中有一些用于绑定(bind)的简单代码,如下所示: s
我在 Spring MVC 中设置 initBinder 时遇到一些问题。我有一个 ModelAttribute,它有一个有时会显示的字段。 public class Model { privat
我正在尝试通过jquery post发布knockoutjs View 模型 var $form = $('#barcodeTemplate form'); var data = ko.toJS(vm
如何为包含多态对象集合的复杂模型编写自定义模型绑定(bind)程序? 我有下一个模型结构: public class CustomAttributeValueViewModel { publi
您好,我正在尝试实现我在 this article 中找到的扩展方法对于简单的注入(inject)器,因为它不支持开箱即用的特定构造函数的注册。 根据这篇文章,我需要用一个假的委托(delegate)
你好,我想自动注册我的依赖项。 我现在拥有的是: public interface IRepository where T : class public interface IFolderReposi
我正在使用 Jasmine 测试一些 Angular.js 代码。为此,我需要一个 Angular 注入(inject)器: var injector = angular.injector(['ng'
我正在使用 Matlab 代码生成器。不可能包含代码风格指南。这就是为什么我正在寻找一个工具来“ reshape ”、重命名和重新格式化生成的代码,根据我的: 功能横幅约定 文件横幅约定 命名约定 等
这个问题在这里已经有了答案: Where and why do I have to put the "template" and "typename" keywords? (8 个答案) 关闭 8
我开发了一种工具,可以更改某些程序的外观。为此,我需要在某些进程中注入(inject)一个 dll。 现在我基本上使用这个 approach .问题通常是人们无法注入(inject) dll,因为他们
我想使用 swing、spring 和 hibernate 编写一个 java 应用程序。 我想使用数据绑定(bind)器用 bean 的值填充 gui,并且我还希望它反射(reflect) gui
我有这段代码,当两个蜘蛛完成后,程序仍在运行。 #!C:\Python27\python.exe from twisted.internet import reactor from scrapy.cr
要点是 Spring Batch (v2) 测试框架具有带有 @Autowired 注释的 JobLauncherTestUtils.setJob。我们的测试套件有多个 Job 类提供者。因为这个类不
我是一名优秀的程序员,十分优秀!