- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有性能至关重要的代码,并且有一个巨大的函数在函数开始时在堆栈上分配40个大小不同的数组。这些阵列中的大多数必须具有一定的对齐方式(因为使用需要内存对齐的cpu指令(对于Intel和ARM CPU)可以在链中的其他位置访问这些阵列。
由于某些版本的gcc根本无法正确对齐堆栈变量(特别是对于arm代码),甚至有时它表示目标体系结构的最大对齐量小于我的代码实际请求的数量,因此我只能选择分配这些数组在堆栈上并手动对齐。
因此,对于每个数组,我需要执行类似的操作以使其正确对齐:
short history_[HIST_SIZE + 32];
short * history = (short*)((((uintptr_t)history_) + 31) & (~31));
history
现在在32字节边界上对齐。对所有40个数组执行相同的操作很繁琐,再加上这部分代码确实占用大量CPU,因此我无法为每个数组执行相同的对齐技术(此对齐困惑会混淆优化器,并且不同的寄存器分配会减慢函数的运行时间) ,有关详细说明,请参阅问题末尾的说明)。
struct tmp
{
short history[HIST_SIZE];
short history2[2*HIST_SIZE];
...
int energy[320];
...
};
char buf[sizeof(tmp) + 32];
tmp * X = (tmp*)((((uintptr_t)buf) + 31) & (~31));
alloca
,然后将指针对齐到该堆栈空间,然后将此内存块重新解释为某种具有定义良好布局的结构只要结构本身正确对齐,就可以保证某些变量的对齐。我正在尝试使用各种方法来转换内存,将大堆栈分配移到一个单独的函数上,但仍然会得到错误的输出和堆栈损坏,我真的开始越来越多地认为这个巨大的功能会在gcc中碰到某种错误,这很奇怪,通过执行这种强制转换,无论我如何尝试,都无法完成该工作。禁用了所有需要对齐的优化,它现在是纯C风格的代码,但仍然得到不好的结果(非位精确输出和偶然的堆栈损坏崩溃)。修正了所有问题的简单修复程序,我写的不是:char buf[sizeof(tmp) + 32];
tmp * X = (tmp*)((((uintptr_t)buf) + 31) & (~31));
tmp buf;
tmp * X = &buf;
tmp buf;
tmp * X = &buf;
struct tmp * to_struct_tmp(void * buffer32)
{
return (struct tmp *)buffer32;
}
tmp buf;
tmp * X = to_struct_tmp(&buf);
tmp * X
与tmp buf
不相关,并且在从to_struct_tmp返回后立即将tmp buf
删除为未使用的变量?还是做一些奇怪的事情而产生意想不到的结果。我还尝试检查生成的程序集,但是,将tmp * X = &buf;
更改为tmp * X = to_struct_tmp(&buf);
会为该函数生成完全不同的代码,因此,混叠规则一定程度上会极大地影响代码生成。tmp
结构的同一位置;换句话说,我的巨型结构与该函数的其他变量共享相同的堆栈内存。只有这可以解释为什么它总是导致相同的不良结果。 -fno-strict-aliasing可以解决此问题,如本例所述。最佳答案
只需禁用基于别名的优化并称之为一天
如果您的问题实际上是由与严格别名相关的优化引起的,那么-fno-strict-aliasing
将解决问题。此外,在这种情况下,您不必担心会丢失优化,因为根据定义,这些优化对您的代码而言是不安全的,因此您无法使用它们。
Praetorian的要点。我记得在gcc中引入别名分析后,一个开发人员的歇斯底里。某位Linux内核作者希望(A)为事物添加别名,并且(B)仍获得该优化。 (这是一个过分的简化,但是-fno-strict-aliasing
似乎可以解决问题,花费不多,而且所有人都必须有其他鱼来油炸。)
关于c++ - 严格的别名和内存对齐,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14170010/
最近我遇到了 AngularJS Strict DI 模式。使用它的目的和好处是什么?通过在移动设备上使用它,我们会获得显着的性能提升吗? 我尝试将它应用到我的代码中,并且在编写代码时我没有做任何注释
要在复制文本的底部添加额外信息 - 我想使用以下 JS: document.addEventListener('copy', (event) => { const pagelin
Java 是否有一个好的、严格 的日期解析器?我可以访问 Joda-Time,但我还没有看到这个选项。我发现了“Is there a good date parser for Java”这个问题,虽然
在下面的网页中,图像和 div 之间有几个像素的间隙。 (我已经在 Firefox 3 和 Safari 4 中测试过。) 我怎样才能缩小差距? body { background-color:
前段时间我遇到了一个“问题”,但我一直没有弄清楚。希望有人能照亮它。当我将 DOCTYPE 从严格更改为过渡时,是什么导致某些浏览器(Chrome、Opera 和 Safari)以不同方式呈现页面。我
PHP 以其类型杂耍而闻名。我必须承认这让我很困惑,而且我很难在比较中找出基本的逻辑/基本内容。 例如:如果 $a > $b 为真且 $b > $c 为真,是否意味着 $a > $c总是也是真的吗?
有在ECMAScript Language Specification11.9.1 等于运算符 (==): NOTE 3 The equality operator is not always tra
考虑这些不同的尝试,比如 last : Prelude> import Data.Foldable Prelude Data.Foldable> foldr const undefined (reve
我正在考虑使用 jQuery 元数据插件。看起来很有趣,但是... ... alert($('li.someclass').metadata().some); 这段代码有效吗? 更新 当然这是一个老例
我有一个 CSS 文件,我的本地开发服务器(webpack)正在提供一个显然错误的 mime 类型。 Refused to apply style from 'http://localhost:100
因此对于 Google Chrome 和 Opera,cookie 具有 SameSite 属性,该属性可以具有以下两个值之一:strict 或 lax。 它们之间的一些区别之一是 SameSite=
我试图到处寻找这个问题的答案,但似乎我运气不好。 我有一个非常简单的 Mongoose 模型 var userObject = { profile: { username: {
我正在为必须使用 XHTML 1.0 Strict 进行验证的类编写程序。根据 w3 的验证程序,我的页面通过了验证。我还有一个 HTML5 版本(这是原始版本),它可以按应有的方式进行验证和工作。
我得到了很多 validation errors因为 在 里面。如果我删除 br 标签,那么它工作正常。 为什么会产生问题? 最佳答案 不是br在p里面,而是你没有结束 br与 /特点。你有 在代码中
好吧,这让我抓狂。 我想在我的文档周围加上边框。它应该很好地绕过整个窗口/视口(viewport)。所以我定义: body { border: 1px solid red; } 当我的文档处于 q
我在 MySql 服务器上运行的查询遇到问题。这是查询: SELECT itms.Gender,itms.Age, (CASE WHEN (plv.Discount = 0 OR t1.EverGre
我有以下 javascript 函数,如果所有必填字段都不完整并且是我使用 Google Apps 脚本创建的表单的一部分,它会阻止表单提交。请注意,#submitbutton 实际上是一个常规按钮,
我是一名优秀的程序员,十分优秀!