- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在学习Windows下的X64汇编语言和MASM64,就是看最新版的《64位汇编语言的艺术》一书。
我有一个关于书中引用的问题:
You do have to worry about MMU page organization in memory in one situation. Sometimes it is convenient to access (read) data beyond the end of a data structure in memory. However, if that data structure is aligned with the end of an MMU page, accessing the next page in memory could be problematic. Some pages in memory are inaccessible; the MMU does not allow reading, writing, or execution to occur on that page.Attempting to do so will generate an x86-64 general protection (segmentation) fault and abort the normal execution of your program. If you have a data access that crosses a page boundary, and the next page in memory is inaccessible, this will crash your program. For example, consider a word access to a byte object at the very end of an MMU page, asshown in Figure 3-2.
As a general rule, you should never read data beyond the end of a data structure. If for some reason you need to do so, you should ensure that it is legal to access the next page in memory (alas, there is no instruction on modern x86-64 CPUs to allow this; the only way to be sure that access is legal is to make sure there is valid data after the data structure you are accessing).
所以我的问题是:假设我有那个确切的案例。数据段末尾的字变量。如何防止异常?通过手动填充 00h 单元格?正确地将每个变量与其大小对齐?如果我对齐所有内容,如果最后一个变量是跨越 4k 边界的 qword 会发生什么?如何预防?
MASM 会自动分配另一个顺序数据段来容纳它吗?
最佳答案
读取页面中已知包含任何有效字节的任何位置是安全的,例如在具有未对齐的 foo: dq 1
的静态存储中。如果你有它,mov rax, [foo]
总是安全的。
您的汇编器 + 链接器将确保 .data
、.rdata
和 .bss
中的所有存储实际上都由有效页面支持操作系统会让你触摸。
你的书的意思是你可能有一个 3 字节结构的数组,例如 RGB 像素。 x86 没有 3 字节加载,因此使用 mov eax, [rcx]
加载整个像素结构实际上会加载 4 个字节,包括您不关心的 1 个字节。
通常这很好,除非 [rcx+3]
位于未映射的页面中。 (例如,缓冲区的最后一个像素,在页面末尾结束,下一页未映射)。跨入另一个不需要数据的缓存行对性能来说不是很好,因此这是与 2 或 3 个单独加载(如 movzx eax, word ptr [rcx]
/movzx)的权衡edx, byte ptr [rcx+2]
这在 SIMD 中更常见,您可以在加载它们后在寄存器中一次更多地使用多个元素。像 movdqu xmm0, [rcx]
加载 16 个字节,包括 5 个完整像素和我们不打算在此向量中处理的另一个像素的 1 个字节。
(平面 RGB 没有这个问题,其中所有 R 分量都是连续的。或者一般来说,AoS 与 SoA = 数组结构对 SIMD 有好处。如果展开,你也不会有这个问题你的循环是 3 或什么,所以 3x 16 字节向量 = 48 字节覆盖 16x 3 字节像素,如果需要,可能会做一些改组或者有 3 个不同的向量常量,如果你需要不同的常量来排列你的结构的不同组件或像素或其他。)
如果遍历一个数组,你在最后一次迭代中会遇到同样的问题。如果数组大于 1 个 SIMD 向量(XMM 或 YMM),而不是最后一个 n % 4
元素的标量,您有时可以安排在数组末尾结束的 SIMD 加载,因此它与先前的完整向量部分重叠。 (为了减少分支,保留 1..4 个清理元素而不是 0..3,所以如果 n
是向量宽度的倍数,那么“清理”是另一个完整向量。)这有效非常适合制作 ASCII 字符串的小写副本:重做任何给定字节的工作很好,而且你没有就地存储,所以你甚至没有存储转发停顿,因为你不会'负载与以前的商店重叠。对数组求和(您需要避免重复计算)或就地工作不太容易。
另见 Is it safe to read past the end of a buffer within the same page on x86 and x64?
这对 strlen
来说是一个挑战,您不知道您被允许读取的数据是否延伸到下一页。 (除非您一次只读取 1 个字节,这比使用 SSE2 慢 16 倍。)
AVX-512 通过故障抑制屏蔽了加载/存储,因此 k1=0x7F 的 vmovdqu8 xmm0{k1}{z}, [rcx]
将有效地加载 15 字节,而不是即使第 16 个字节(掩码为零)扩展到未映射的页面,也会出现错误。与 AVX vmaskmovps
等相同。但是 AMD 上的商店版本很慢。
Attempting to do so will generate an x86-64 general protection (segmentation) fault
实际上是一个 #PF
页面错误,用于访问未映射或权限被拒绝的页面。但是,是的,同样的区别。
关于assembly - 访问跨 MMU 页边界的变量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/72479456/
关闭。这个问题是opinion-based 。目前不接受答案。 想要改进这个问题吗?更新问题,以便 editing this post 可以用事实和引文来回答它。 . 已关闭 4 年前。 Improv
PowerShell Web Access 允许您通过 Web 浏览器运行 PowerShell cmdlet。它显示了一个基于 Web 的控制台窗口。 有没有办法运行 cmdlet 而无需在控制台窗
我尝试在无需用户登录的情况下访问 Sharepoint 文件。 我可以通过以下任一方式获取访问 token 方法一: var client = new RestClient("https://logi
我目前正在尝试通过 Chrome 扩展程序访问 Google 服务。我的理解是,对于 JS 应用程序,Google 首选的身份验证机制是 OAuth。我的应用目前已成功通过 OAuth 向服务进行身份
假设我有纯抽象类 IHandler 和派生自它的类: class IHandler { public: virtual int process_input(char input) = 0; };
我有一个带有 ThymeLeaf 和 Dojo 的 Spring 应用程序,这给我带来了问题。当我从我的 HTML 文件中引用 CSS 文件时,它们在 Firebug 中显示为中止。但是,当我通过在地
这个问题已经有答案了: JavaScript property access: dot notation vs. brackets? (17 个回答) 已关闭 6 年前。 为什么这不起作用? func
我想将所有流量重定向到 https,只有 robot.txt 应该可以通过 http 访问。 是否可以为 robot.txt 文件创建异常(exception)? 我的 .htaccess 文件: R
我遇到了 LinkedIn OAuth2: "Unable to verify access token" 中描述的相同问题;但是,那里描述的解决方案并不能解决我的问题。 我能够成功请求访问 toke
问题 我有一个暴露给 *:8080 的 Docker 服务容器. 我无法通过 localhost:8080 访问容器. Chrome /curl无限期挂断。 但是如果我使用任何其他本地IP,我就可以访
我正在使用 Google 的 Oauth 2.0 来获取用户的 access_token,但我不知道如何将它与 imaplib 一起使用来访问收件箱。 最佳答案 下面是带有 oauth 2.0 的 I
我正在做 docker 入门指南:https://docs.docker.com/get-started/part3/#recap-and-cheat-sheet-optional docker-co
我正在尝试使用静态 IP 在 AKS 上创建一个 Web 应用程序,自然找到了一个带有 Nginx ingress controller in Azure's documentation 的解决方案。
这是我在名为 foo.js 的文件中的代码。 console.log('module.exports:', module.exports) console.log('module.id:', modu
我试图理解访问键。我读过https://docs.aws.amazon.com/general/latest/gr/aws-sec-cred-types.html#access-keys-and-se
我正在使用 MGTwitterEngine"将 twitter 集成到我的应用程序中。它在 iOS 4.2 上运行良好。当我尝试从任何 iOS 5 设备访问 twitter 时,我遇到了身份验证 to
我试图理解访问键。我读过https://docs.aws.amazon.com/general/latest/gr/aws-sec-cred-types.html#access-keys-and-se
我正在使用以下 API 列出我的 Facebook 好友。 https://graph.facebook.com/me/friends?access_token= ??? 我想知道访问 token 过
401 Unauthorized - Show headers - { "error": { "errors": [ { "domain": "global", "reas
我已经将我的 django 应用程序部署到 heroku 并使用 Amazon s3 存储桶存储静态文件,我发现从 s3 存储桶到 heroku 获取数据没有问题。但是,当我测试查看内容存储位置时,除
我是一名优秀的程序员,十分优秀!