- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
只是为了学习这个,我试图掌握如何使用HLE prefixes XACQUIRE
和 XRELEASE
.阅读英特尔文档后,我的理解是在使用 XACQUIRE
执行指令后前缀 CPU 进入某种写锁,直到带有 XRELEASE
的指令字首。所以我写了下面的测试代码,看看我是否正确。嗯,还有一些我不明白的地方,因为我的代码示例失败了。
那么有人可以告诉我这些 HLE 前缀遗漏了什么吗?
两次失败:
xtest
指令报告未启用 HLE,并且 .code
testCPUID PROC
push rbx
; CPUID.07h.EBX.HLE[bit 4]==1
mov eax, 7h
xor ecx, ecx
cpuid
and rbx, 1 shl 4
mov rax, rbx
pop rbx
ret
testCPUID ENDP
testHLEWrite PROC
; RCX = pointer to TST91 struct:
; void* pPtrToNextWrite;
; int nNextValue;
; void* pCutoffPtr;
; void* pBeginPtr;
xor edx, edx
xacquire xchg [rcx], rdx ; I'm assuming that this will work as a mutex ...
xtest ; Sanity check to see if HLE got enabled?
jnz lbl_00 ; If HLE is on => ZF=0
int 3 ; we get here if HLE did not get enabled
lbl_00:
; Do some nonsensical stuff
; The idea is to write sequential values into a shared array
; to see if the lock above holds
; Format:
; > --16 sequential bytes-- <
mov r8d, dword ptr [rcx + 8]
mov byte ptr [rdx], '>'
inc rdx
; Write 16 sequential bytes
mov rax, 10h
lbl_01:
mov byte ptr [rdx], r8b
inc r8
inc rdx
dec rax
jnz lbl_01
mov byte ptr [rdx], '<'
inc rdx
cmp rdx, [rcx + 10h] ; check if reached the end of buffer
jb lbl_02
mov rdx, [rcx + 18h] ; reset ptr to the beginning of buffer
lbl_02:
mov dword ptr [rcx + 8], r8d
xrelease mov [rcx], rdx ; this will release the mutex
ret
testHLEWrite ENDP
testHLEForCorrectness PROC
; RCX = pointer to TST91 struct:
; void* pPtrToNextWrite;
; int nNextValue;
; void* pCutoffPtr;
; void* pBeginPtr;
xor edx, edx
xacquire xchg [rcx], rdx ; I'm assuming that this will work as a mutex ...
xtest ; Sanity check to see if HLE got enabled?
jnz lbl_00 ; If HLE is on => ZF=0
int 3 ; we get here if HLE did not get enabled
lbl_00:
mov r9, [rcx + 18h]
lbl_repeat:
cmp r9, rdx
jae lbl_out
cmp byte ptr [r9], '>'
jnz lbl_bad
cmp byte ptr [r9 + 1 + 10h], '<'
jnz lbl_bad
mov r8b, byte ptr [r9 + 1]
sub eax, eax
lbl_01:
cmp [r9 + rax + 1], r8b
jnz lbl_bad
inc rax
inc r8
cmp rax, 10h
jb lbl_01
add r9, 2 + 10h
jmp lbl_repeat
lbl_out:
xrelease mov [rcx], rdx ; this will release the mutex
ret
lbl_bad:
; Verification failed
int 3
testHLEForCorrectness ENDP
END
#include <assert.h>
#include <Windows.h>
struct TST91{
BYTE* pNextWrite;
int nNextValue;
BYTE* pCutoffPtr;
BYTE* pBeginPtr;
};
extern "C" {
BOOL testCPUID(void);
void testHLEWrite(TST91* p);
void testHLEForCorrectness(TST91* p);
};
DWORD WINAPI ThreadProc01(LPVOID lpParameter);
TST91* gpStruct = NULL;
BYTE* gpMem = NULL; //Its size is 'gszcbMemSize' BYTEs
const size_t gszcbMemSize = 0x1000 * 8;
int main()
{
if(testCPUID())
{
gpStruct = new TST91;
gpMem = new BYTE[gszcbMemSize];
gpStruct->pNextWrite = gpMem;
gpStruct->nNextValue = 1;
gpStruct->pBeginPtr = gpMem;
gpStruct->pCutoffPtr = gpMem + gszcbMemSize - 0x100;
for(int t = 0; t < 5; t++)
{
CloseThread(CreateThread(NULL, 0,
ThreadProc01, (VOID*)(1LL << t), 0, NULL));
}
_gettch();
delete gpStruct;
delete[] gpMem;
}
else
_tprintf(L"Your CPU doesn't support HLE\n");
return 0;
}
DWORD WINAPI ThreadProc01(LPVOID lpParameter)
{
if(!SetThreadAffinityMask(GetCurrentThread(), (DWORD_PTR)lpParameter))
{
assert(NULL);
}
for(;;)
{
testHLEWrite(gpStruct);
testHLEForCorrectness(gpStruct);
}
return 0;
}
最佳答案
你可以回答你自己的问题,不是吗?
反正。我想我明白了。我会尽量坚持使用简单的英语,或者按照我的理解方式进行。如果我做出了不正确的陈述,请随意编辑它。 (顺便说一句, Hardware Lock Elision
,多酷的名字。听起来像是马特·达蒙的电影。我什至不得不在谷歌上搜索“elision”这个词才能理解它的意思……但我还是不记得了。)
所以这个HLE概念无非是提示CPU对待lock
以更优化的方式添加前缀。 lock
对于现代处理器以有效方式执行而言,前缀本身有点“昂贵”。因此,当支持它的 CPU 看到 HLE 前缀时,它最初不会获取锁,但只有在发生读/写冲突时才会这样做。在这种情况下,CPU 将发出 HLE 中止,这反过来将需要稍后的常规锁定。
此外,XACQUIRE
的 HLE 前缀是 F2
,并为 XRELEASE
是 F3
,无非是老派REPNE
和 REP
前缀,当与 lock
一起使用时会被忽略- 不支持 HLE 的旧 CPU 的指令。这一切意味着使用 HLE 不需要检查 CPUID
其支持的说明,并且可以按原样安全地使用它们。较旧的 CPU 将忽略它们并处理伴随的 lock
前缀作为锁,而较新的 CPU 会将它们作为优化提示。换句话说,使用那些 XACQUIRE
和 XRELEASE
如果您将前缀添加到您自己的互斥锁、信号量的实现中,前缀不会有任何伤害。
话虽如此,我不得不这样重写我的原始测试代码示例(只是 非常基本的 互斥类型锁的相关并发部分)。
进入锁的ASM代码:
testHLEWrite PROC
; RCX = pointer to TST91 struct:
; void* pPtrToNextWrite;
; int nNextValue;
; void* pCutoffPtr;
; void* pBeginPtr;
; size_t lock; <-- new member
lbl_retry:
xacquire lock bts qword ptr [rcx + 20h], 1 ; Try to acquire lock (use HLE hint prefix)
jnc lbl_locked
pause ; Will issue an implicit HLE abort
jmp lbl_retry
lbl_locked:
XRELEASE
前缀与
lock
前缀的不同之处在于它支持具有内存目标操作数的
mov
指令。)
xrelease mov qword ptr [rcx + 20h], 0 ; Release the lock (use HLE prefix hint)
ret
testHLEWrite ENDP
//Some variable to hold the lock
volatile long lock = 0;
//Acquire the lock
while(_interlockedbittestandset_HLEAcquire((long *)&lock, 1))
{
_mm_pause();
}
//Leave the lock
_Store_HLERelease(&lock, 0);
关于assembly - 如何使用 XACQUIRE、XRELEASE Hardware Lock Elision (HLE) 前缀提示?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51578062/
我的 friend 编写了一个程序,它比较随机排列的骰子面,以找到分布最均匀的面——尤其是当面不仅仅是序列时。 我将他的程序翻译成 haskell 是因为我一直在寻找一个理由来让别人知道 haskel
我需要对表单中的某些字段进行评论/提示。我的想法是在模型中描述它,就像attributeLabels一样。我该怎么做? 然后它会是理想的,如果 Gii 模型(和 Crud)生成器直接从 mysql 列
我们使用 FastReport 来生成报告。事实上,我们为访问源代码付费。 我们目前使用的是 FastReport 的最新稳定版本。虽然它对于我们的生产来说足够稳定,但每当我编译时,我都会看到以下内容
我需要创建一个对话框/提示,包括用于用户输入的文本框。我的问题是,确认对话框后如何获取文本?通常我会为此创建一个类,将文本保存在属性中。不过我想使用 XAML 设计对话框。因此,我必须以某种方式扩展
我想提示用户是否要执行操作(删除) - 用警报框说"is"或“否”,如果是,则运行删除脚本,如果否,则不执行任何操作 我不太了解 javascript,因此是否有人可以使用 javascript 获得
所以我正在编写一个简单的 JS 代码。我们刚刚开始学习函数。我需要创建一个名为“printStars”的函数。 我需要从用户那里获取一个号码,并根据该号码打印“*”。 这就是我所做的:
我在我的页面上添加了一个提示,但它在页面加载之前加载了。如何仅在整个页面可见时才显示消息? 这是我的提示: if (name == null || name == "") { txt == "No
我在我的页面上添加了一个提示,但它在页面加载之前加载了。如何仅在整个页面可见时才显示消息? 这是我的提示: if (name == null || name == "") { txt == "No
我正在自定义我的 zsh 提示,并发现以下内容来检查是否有任何后台作业: if [[ $(jobs | wc -l) -gt 0 ]]; then # has background job(s)
这个问题在这里已经有了答案: JavaScript object: access variable property by name as string [duplicate] (3 个答案) pa
我正在尝试用 javascript 制作一个简单的数学练习程序。在提示警报中给出不同的值,并将答案与用户输入进行比较。这是代码: Calculations generate(); functio
在这段代码中,尽管我使用了文本对齐属性在“编辑文本” View 的中心设置“提示”。但它无法正常工作。 最佳答案 尝试 关于android - 如何在编辑文本的中心对齐文本(提示),我们在Sta
我正在尝试让我的 EditText 显示一个提示,例如“请在此处输入答案”,当用户点击 EditText 以键入他们的答案时,文本应该消失并留空,以便他们在其中输入答案. 截至目前,这就是我的 .xm
我当前的 android 应用程序中有两个微调器,我想要一个默认值,例如 editText 的 android:hint 功能。有没有办法这样做,但不会将提示添加到填充微调器的字符串数组。例如从微调器
如果我的表单已完全填写,我如何提示“感谢您填写表单,“name”!” function submit_onclick() { if(confirm("Thanks for completing t
我刚刚了解了prompt()命令;我知道 Prompt() 命令以字符串的形式返回用户输入。我正在搞乱下面的程序,我输入了Per“Dead”Ohlin作为男性名字。为什么这有效并且没有引起任何问题?
void openUpNow(FILE *x, FILE *y) { x = fopen("xwhatever", "r"); y = fopen("ywhatever", "r");
我有一个作业正在处理,但我在使用 prompt() 方法时遇到了问题。我看到我可以做一个提示,但我需要几个并且有数量。 例如... 我创建了一个 HTML 表格,其中包含许多艺术家和包含 DVD、CD
我正在学习 Big Nerd Ranch 的 iOS Programming, 2nd Edition,我已经来到第 4 章挑战:标题。该练习暗示我感到困惑;它说我需要做一些我认为不需要做的事情。 到
抱歉,如果这是微不足道的,但我没有找到任何解决此问题的建议。我在 Ubuntu 上,我的 Yii 项目需要 PHPUnit。我已经安装了 PHPUnit 两次,方法是下载 phpunit.phar 并
我是一名优秀的程序员,十分优秀!