- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我正在尝试实现图像处理功能。在这里:
typedef void (*AgFilter)(int*, int*, int*, float*);
static void filter(AndroidBitmapInfo* info, void* pixels, AgFilter func, void* params){
for(y = 0; y < height; y++){
for(x = 0; x < width; x++){
//initizalie r, g, b
func(&r, &g, &b, params); //here is the problem
}
}
}
我将此函数作为 func
传递:
static inline void brightness(int *r, int *g, int *b, float* param){
float add = param[0];
*r += add;
*g += add;
*b += add;
}
问题是它的运行速度极慢。好吧,我能理解。 但是 如果我不通过引用传递函数而是直接在filter
中编写我的函数(代替func
调用),它的运行速度要快得多。问题出在哪里?
附言请注意,它不是 c++
编辑
这个工作很快:
static void filter(AndroidBitmapInfo* info, void* pixels, int add){
for(y = 0; y < height; y++){
for(x = 0; x < width; x++){
//initizalie r, g, b
r += add;
g += add;
b += add;
}
}
}
最佳答案
调用函数需要时间。通常,您不会注意到,但您会调用该函数一百万次(全高清 1920x1080 图像大约两百万次)。现代相机创建 16 个百万像素图像。如果每次调用花费 1 us,则调用函数(不实际执行函数体)的累计时间将为 16 秒。
如何让它更快?一些建议:
不传递四个参数,而是使用结构:
struct data { int r,g,b; float* param; }
分配一次并重用它。现在您可以使用单个参数调用 func
。
内存布局可能有问题。 param
在内存中的任何地方。将其复制到 struct data
中:
struct data { int r,g,b, add; }
原因是 param
位于内存中的任何位置,这意味着它可能位于不同的缓存行中。如果您可以将所有数据放入一个 64 字节结构中,那么所有数据都将放入一个缓存行中,这可以极大地提升性能。
但在您的情况下可能不是,因为您总是访问 param[0]
。当您以随机方式访问数组时,这是一个更大的问题。
交换移位和位掩码操作:
r = (int) ((line[x] & >> 16 ) & 0xFF);
可以提供小幅提升,因为所有三种颜色现在都将被 0xFF
屏蔽,这允许编译器将常量移动一次到 CPU 寄存器。
调用函数时,所有的CPU寄存器都需要“保存/恢复”。那要花时间。当函数被内联时,编译器知道哪些 CPU 寄存器被丢弃并可以相应地进行优化。
实际上,CPU寄存器并没有被保存(至少我已经很久没有看到了)。现代编译器只是假定在调用该函数后,所有这些都已更改。
请注意,inline
没有任何效果,因为您是通过引用传递函数而不是直接调用它。
使用线程。这对于并行化来说非常简单:在 1/N 的数据上运行函数 N 次(每个 CPU 内核一次)。这将使您获得大约 N 倍的性能提升。
关于c - 需要帮助优化函数调用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12154693/
我有这个问题: 我们声称对 float 使用相等测试是不安全的,因为算术运算会引入舍入错误,这意味着两个应该相等的数字实际上并不相等。 对于这个程序,您应该选择一个数字 N,并编写一个程序来显示 1
为什么这个脚本的输出是 5 而不是 8 ? 我认为 -- 意味着 -1 两次。 var x = 0; var y = 10; while ( x
我现在可以从 cmd 窗口中执行的 FFmpeg 过程中读取最后一行。 使用脚本主机模型对象引用此源。 Private Sub Command1_Click() Dim oExec
使用 vlookup,当匹配发生时,我想从匹配发生的同一行显示工作表 2 中 C 列的值。我想出的公式从 C 列表 2 中获取值,但它从公式粘贴在表 3 上的行中获取,而不是从匹配发生的位置获取。 这
我在破译 WCF 跟踪文件时遇到了问题,我希望有人能帮助我确定管道中的哪个位置发生了延迟。 “Processing Message XX”的跟踪如下所示,在事件边界和传输到“Process Actio
我有四个表,USER、CONTACT、CONACT_TYPE 和 USER_CONTACT USER_CONTACT 存储用户具有填充虚拟数据的表的所有联系人如下 用户表 USER_ID(int)|
以下有什么作用? public static function find_by_sql($sql="") { global $database; $result_set = $data
我正在解决 JavaBat 问题并且对我的逻辑感到困惑。 这是任务: Given a day of the week encoded as 0=Sun, 1=Mon, 2=Tue, ...6=Sat,
我正在研究一些 Scala 代码,发现这种方法让我感到困惑。在匹配语句中,sublist@ 是什么?构造?它包含什么样的值(value)?当我打印它时,它与 tail 没有区别,但如果我用尾部替换它,
我正在使用以下代码自行缩放图像。代码很好,图像缩放也没有问题。 UIImage *originImg = img; size = newSize; if (originImg.size.width >
Instruments 无法在我的 iPad 和 iPhone 上启动。两者都已正确配置,我可以毫无问题地从 xcode 调试它们上的代码,但 Instruments 无法启动。 我听到的只是一声嘟嘟
我想用 iPhone 的 NSRegularExpression 类解析此文本: Uploaded652.81 GB 用于摘录上传和652.81文本。 最佳答案 虽然我确实认为 xml 解析器更适合解
我找到了 solution在 Stackoverflow 上,根据过滤器显示 HTML“li”元素(请参阅附件)。本质上基于 HTML 元素中定义的 css 类,它填充您可以从中选择的下拉列表。 我想
这是一个简单的问题,但我是在 SQL 2005 中形成 XML 的新手,但是用于形成如下所示表中的 XML 的最佳 FOR XML SQL 语句是什么? Column1 Column2 -
我在 www.enigmafest.com 有一个网站!您可以尝试打开它!我面临的问题是,在预加载器完成后,主页会出现,但其他菜单仍然需要很长时间才能加载,而且声音也至少需要 5 分钟! :( 我怎样
好吧,我正在尝试用 Haskell 来理解 IO,我想我应该编写一个处理网页的简短小应用程序来完成它。我被绊倒的代码片段是(向 bobince 表示歉意,但公平地说,我并不想在这里解析 HTML,只是
如何使用背景页面来突出显示网站上的某个关键字,无论网站是什么(谷歌浏览器扩展)?没有弹出窗口或任何东西,它只是在某人正在查看的网站上编辑关键字。我以前见过这样的,就是不明白怎么做!谢谢你的帮助。 最佳
我是 Javascript 新手,需要一些帮助。 先看图片: . 积分预测器应用程序。 基本上当用户通过单选按钮选择获胜团队时它应该在积分栏中为获胜队添加 10 分,并且并根据得分高的球队自动对表格进
这是我的情况 - 我要发送一份时事通讯,我试图做的是,当用户单击电子邮件中的链接时,它会重定向到我的网页,然后会弹出一个灯箱,显示视频。我无法在页面加载时触发灯箱,因为您可以在查看灯箱之前转到同一页面
我有这个代码。 ¿Cuanto es ? Ir 我想获取用户输入的“验证码”值。我尝试这个但行不通。有什么帮助吗? var campo = d
我是一名优秀的程序员,十分优秀!