performance - 在循环中插入 nop 以及在 movnti 商店附近阅读时意外减速-6ren

performance - 在循环中插入 nop 以及在 movnti 商店附近阅读时意外减速

转载作者：行者123 更新时间：2023-12-03 16:15:27

26

4

我不明白为什么第一个代码每次迭代有 ~1 个周期，而第二个代码每次迭代有 2 个周期。我用 Agner 的工具和性能进行了测量。根据 IACA，从我的理论计算来看，它也应该需要 1 个周期。

每次迭代需要 1 个周期。

; array is array defined in section data
%define n 1000000
xor rcx, rcx   

.begin:
    movnti [array], eax
    add rcx, 1 
    cmp rcx, n
    jle .begin

每次迭代需要 2 个周期。 但为什么？

; array is array defined in section data
%define n 1000000
xor rcx, rcx   

.begin:
    movnti [array], eax
    nop
    add rcx, 1 
    cmp rcx, n
    jle .begin

这个最终版本每次迭代需要大约 27 个周期。但为什么？毕竟，没有依赖链。

.begin:
    movnti [array], eax
    mov rbx, [array+16]
    add rcx, 1 
    cmp rcx, n
    jle .begin

我的 CPU 是 IvyBridge。

最佳答案

movnti根据 Agner Fog's tables，是 2 uop，并且不能微型 fuse 对于 Ivy 桥。

因此，您的第一个循环是 4 个融合域 uops，并且可以在每个时钟进行一次迭代。
nop是第 5 个融合域 uop(即使它不采用任何执行端口，因此它是 0 个未融合域 uops)。这意味着前端每 2 个时钟只能发出一个循环。

另见 x86标记 wiki 以获取有关 CPU 工作原理的更多链接。

第三个循环可能很慢，因为 mov rbx, [array+16]可能正在从 movnti 的同一缓存行加载驱逐。每次刷新它存储的填充缓冲区时都会发生这种情况。 (不是每个 movnti ，显然它可以在同一个填充缓冲区中重写一些字节。)

关于performance - 在循环中插入 nop 以及在 movnti 商店附近阅读时意外减速，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/37101644/

26

4

0

文章推荐： Gnuplot:未定义/缺失数据点和绘图样式 'with image'

文章推荐： R语言如何使用/或约束进行优化？

文章推荐： sql - 使用两点之间的一组日期(星期日)进行子查询

SQL子查询错误，附近)
我的子查询给出了一个错误:Msg 102, Level 15, State 1, Line 17 Incorrect syntax near ')'. SELECT SalesArea, Branch
sql - SQL语法错误:“(”附近
当我尝试运行此查询时： select branch_no, max (avg_salary) from (select allocatedto, avg (salary) from sta
mysql - 意想不到的角色。 ( "\"附近
所以我正在更新 phpmyadmin 中的表。数据在里面，列已成功创建。当我尝试使用下面的代码添加图像时，出现此错误 Unexpected character. (near "\" at positi
mysql - 意想不到的性格。 (在 "?"附近)
我正在尝试在 phpMyAdmin 中执行以下查询，但出现错误。我已经查看过类似的问题，但我仍然无法弄清楚为什么它不起作用。 INSERT INTO discussion_forum (event_t
C 程序卡在 strcmp 附近
我正在用 C 构建一个 client-server socket 模拟我接受来自客户端的 TCP 连接然后客户端发送消息到我的服务器。我已成功收到消息，然后遍历 structs 的 array 以
sqlite - 错误在 'Autoincrement' 附近
我在 AUTOINCREMENT 附近遇到语法错误。这个错误的原因是什么？ CREATE TABLE person ( id INTEGER NOT NULL AUTOINCREMENT,
java - SQLite: "DATABASE"附近:语法错误
当我尝试使用 java 在 SQLite 中以编程方式创建数据库时，它会在控制台中生成以下错误。 java.sql.SQLException: near "DATABASE": syntax erro
sqlite - 错误:“DISTINCT”附近:语法错误
我似乎无法弄清楚出了什么问题。我尝试查询的子部分，但仍然无法解决问题。表格格式： poi(id int, minX float, minY float, maxX float, maxY float
compiler-errors - “'附近” : syntax error
我在VHDL中编写了以下代码: library IEEE ; use IEEE.STD_LOGIC_1164.all ; entity encoder is port( x : in std_
lua - 预计在 'end' 附近
我在我的游戏服务器中使用这些文件，每次我添加一个新的玩家模型时，我都会得到 [ERROR] lua/autorun/server/fastdlskins.lua:938: '' expected ne
java - 缺少数据库( "where": syntax error) 附近
我正在尝试更新我的 sqlite3 数据库，但出现此错误。我能够成功地将数据插入同一数据库，但无法更新它。请帮忙。 [SQLITE_ERROR] SQL error or missing databa
c# - .NET:如何将我的窗口放在通知区域(系统托盘)附近？
我想在通知区域旁边显示一个小弹出窗口。它类似于 Outlook/Skype/Live! Messenger/etc 在显示有关新消息的通知时会执行此操作。在我的例子中，它将有一些输入控件(文本框、日期
sql - gorp: "auto_increment"附近:语法错误
我正在尝试编写简单的程序以使用 gorp 将行插入表中，但在创建表时出现错误。代码如下: package main import _ "github.com/mattn/go-sqlite3" im
Octave 音阶错误文件名未定义在行 x 列 y 附近
我正在尝试运行工作目录中的 Octave 文件，但出现错误。 Octave 似乎没有认识到它应该运行该文件。 unknown@unknown> dir .
syntax-error - “when”附近: syntax error in VHDL
我正在尝试编写一些代码来模拟具有两个三态缓冲器和VHDL中的上拉电阻的电路。下面是我的代码: library ieee; use ieee.std_logic_1164.all; entity Pul
java - SQL 错误或丢失数据库( "?": syntax error) 附近
你能好心告诉我这里出了什么问题吗？ conn 是 DriverManager.getConnection(DB_URL) try { PreparedState
sqlite - 在“SET”附近:语法错误，尝试设置隔离级别时
我想在go中创建一个事务，同时这样做会出现错误:near "SET": syntax error。代码: db.Exec("SET TRANSACTION ISOLATION LEVEL REPEAT
r - 使用 RColorBrewer 将颜色集中在 0 附近
所以我想用这样的颜色可视化一个矩阵 library(RColorBrewer) vec = rbinom(10000,1,0.1) n = sum(vec) vec = ifelse(vec == 1
java - SQL 错误或丢失数据库( “?” : syntax error) 附近
private static final String QUERY = "SELECT * FROM " + TABLE_SONG_DETAILS + " WHERE " + TABLE_SONG_D
MySQL - 创建触发器错误 1064( 'DELIMITER ; ' 附近)
希望大家一切都好。我正在尝试创建一个 mysql 触发器，但是我不断收到以下错误: [Err] 1064 - You have an error in your SQL syntax; check

首页

博学

6Ren·AI

商城

performance - 在循环中插入 nop 以及在 movnti 商店附近阅读时意外减速