- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我想检索 DRAM 访问次数 在我的应用程序中。准确地说,我需要 区分在数据和代码访问之间。处理器是 Intel(R) Core(TM) i7-4720HQ CPU @ 2.60GHz
(Haswell
)。基于 Intel Software Developer's Manual, Volume 3和 Perf
, 我可以 查找 和 分类 以下与内存访问相关的事件:
(A)
LLC-load-misses [Hardware cache event]
LLC-loads [Hardware cache event]
LLC-store-misses [Hardware cache event]
LLC-stores [Hardware cache event]
=========================================================================
(B)
mem_load_uops_l3_miss_retired.local_dram
mem_load_uops_retired.l3_miss
=========================================================================
(C)
offcore_response.all_code_rd.l3_miss.any_response
offcore_response.all_code_rd.l3_miss.local_dram
offcore_response.all_data_rd.l3_miss.any_response
offcore_response.all_data_rd.l3_miss.local_dram
offcore_response.all_reads.l3_miss.any_response
offcore_response.all_reads.l3_miss.local_dram
offcore_response.all_requests.l3_miss.any_response
=========================================================================
(D)
offcore_response.all_rfo.l3_miss.any_response
offcore_response.all_rfo.l3_miss.local_dram
=========================================================================
(E)
offcore_response.demand_code_rd.l3_miss.any_response
offcore_response.demand_code_rd.l3_miss.local_dram
offcore_response.demand_data_rd.l3_miss.any_response
offcore_response.demand_data_rd.l3_miss.local_dram
offcore_response.demand_rfo.l3_miss.any_response
offcore_response.demand_rfo.l3_miss.local_dram
=========================================================================
(F)
offcore_response.pf_l2_code_rd.l3_miss.any_response
offcore_response.pf_l2_data_rd.l3_miss.any_response
offcore_response.pf_l2_rfo.l3_miss.any_response
offcore_response.pf_l3_code_rd.l3_miss.any_response
offcore_response.pf_l3_data_rd.l3_miss.any_response
offcore_response.pf_l3_rfo.l3_miss.any_response
我的
选择 如下面所述:
LLC-load-misses
的总和和 LLC-store-misses
将返回 整体 DRAM 访问(等效地,我可以使用LLC-misses
在 Perf
)。 mem_load_uops_retired.l3_miss
.LLC-load-misses
- mem_load_uops_retired.l3_miss
=DRAM Accesses for Code
(代码为 只读 )。 local_dram
和 any_response
? offcore_response.all_reads.l3_miss.any_response
的数量事件是 两次多达LLC-load-misses
. demand reads
(即所有 non-prefetched
读取)。这是否意味着,例如:offcore_response.all_data_rd.l3_miss.any_response
- offcore_response.demand_data_rd.l3_miss.any_response
= 预取导致的 DRAM 读取访问 ? Read for Ownership
引起的 DRAM 访问事件操作(用于
Cache Coherency
协议(protocol))。好像
无关的我的问题。
L2-cache
引起的 DRAM 读取
预取器 这也是
无关的我的问题。
最佳答案
根据我对问题的理解,我建议在指定处理器上使用以下两个事件:
OFFCORE_RESPONSE.ALL_READS.L3_MISS.LOCAL_DRAM
:这包括所有可缓存的数据读写事务和所有代码获取事务,无论事务是由指令(退休与否)或预取或任何类型启动的。每个事件恰好代表对内存 Controller 的 64 字节读取请求。 OFFCORE_RESPONSE.ALL_CODE_RD.L3_MISS.LOCAL_DRAM
:这包括对 IMC 的所有代码提取访问。 It seems that the sum of LLC-load-misses and LLC-store-misses willreturn the whole DRAM accesses (equivalently, I could use LLC-missesin Perf).
LLC-load-misses
是 perf
映射到 native 事件的事件 OFFCORE_RESPONSE.DEMAND_DATA_RD.L3_MISS.ANY_RESPONSE
. LLC-store-misses
映射到 OFFCORE_RESPONSE.DEMAND_RFO.L3_MISS.ANY_RESPONSE
. ANY_RESPONSE
bit 指示事件可以针对针对任何单元的请求发生,而不仅仅是 IMC。 For data-only accesses, I used mem_load_uops_retired.l3_miss. It doesnot include stores, but seems to be OK (because stores seem to be muchless frequent?!).
mem_load_uops_retired.l3_miss
存在许多问题在哈斯韦尔:
LLC-load-misses
- mem_load_uops_retired.l3_miss
= DRAM Accesses for Code”的建议是不正确的。 What are local_dram and any_response?
local_dram
是正确的位。
At first, it seems that, group (C), is a higher resolution version ofthe load events of group (A). But my tests show that the events in theformer group is much more frequent than the latter. For example, in asimple benchmark, the number ofoffcore_response.all_reads.l3_miss.any_response events were twice asmany as LLC-load-misses.
offcore_response.all_reads.l3_miss.any_response
包括
LLC-load-misses
并且很容易变得更大。
Group (E), pertains to demand reads (i.e., all non-prefetched reads).Does this mean that, e.g.:offcore_response.all_data_rd.l3_miss.any_response -offcore_response.demand_data_rd.l3_miss.any_response = DRAM readaccesses caused by prefeching?
any_response
位如上所述,关于performance-testing - DRAM 访问的性能计数器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/66392569/
我在leetcode上看到这段代码,是一道求众数的题,下面是题目描述: 给定一个大小为 n 的数组,找到多数元素。众数元素是出现次数超过 ⌊ n/2 ⌋ 次的元素。 你可以假设数组是非空的并且多数元素
每次在 JavaScript 中执行特定操作时,例如: $(function() { $('#typing').keyup(function () { switch($(this)
我一直在为网页设计一个计数器,但我一直被这个我无法解决的功能所困扰。 我有一个 4 个 div 的计数器,因为其中两个是小数字,另外两个是大数字,所以第一个运行得很快,我看不到它们的功能。 有人知道如
我已经在文档中进行了一些搜索,并在网上花了一段时间,但找不到解决方案!我希望警报告诉我单击 .thumb 时它处于each() 的哪一次迭代。 EG:有六个.thumb,我点击数字3,浏览器弹出3!
在 Handlebars 中,假设我有 names 的集合.我能怎么做 {{#each names}} {{position}} {{name}} {{/each}} 在哪里 {{position}}
这个问题在这里已经有了答案: Numbering rows within groups in a data frame (9 个回答) 4年前关闭。 我们如何在数据帧的每组中生成唯一的 ID 号?以下
我正在努力解决以下问题。我希望为给定的“一”序列创建一个计数器。例如,我有以下内容: 1 1 1 1 0 0 1 1 1 0 0 1 1 1 1 鉴于该序列,我希望为 1 的每个序列设置一个计数器直到
我正在努力解决以下问题。我希望为给定的“一”序列创建一个计数器。例如,我有以下内容: 1 1 1 1 0 0 1 1 1 0 0 1 1 1 1 鉴于该序列,我希望为 1 的每个序列设置一个计数器直到
我有一个jsfiddle here 这是一个简单的 JavaScript 函数,可以计算出设定的数字。 是否可以进行这种计数,但也保留一位小数 所以它算 1.1、1.2、1.3 等。 func
我正在构建一个计数器,当我按下鼠标时,它应该增加到 maxValue 并且减少不超过 0。我还可以选择将计数器重置为其初始值:0。另外,如果 maxValue 是偶数,它应该计数到该数字。但是,如果
所以我成功地为字母和单词构建了其他计数器,但现在我只能用这个来计算句子。我的代码如下,当我运行它时,它会返回很多错误消息: #include #include #include int main
Closed. This question is off-topic。它当前不接受答案。
我需要一个计数器,它会随着某些任务的完成而递增。我们只需要最后一小时的值,即窗口将移动而不是静态时间。 解决此问题的最佳方法是什么?我能想到的一种方法是拥有一个大小为 60 的数组,每分钟一个,并更新
我希望使用计数器来为我提供独特的引用系统。我想单击一个按钮,然后检查一个字段/文件中的最后一个数字,然后简单地向其添加 1,然后将其插入到屏幕上的字段中? 不确定执行此操作的最佳方法或具体如何执行此操
我有一个用 php 制作的表格,在该表格内我显示了数据库中的一些内容。我在每个 td 中创建了一个简单的按钮(类似于 Like),我希望每次点击它都会增加 1。这是带有按钮的行: echo "
如何将数据库中的值转换为可用于 if else 函数的 int 值? 例如:在我的数据库“armnumber = 3”中,如何在 if else 函数中使用它? 代码 string myConnect
我需要生成唯一的“ids”,问题是,它只能在 1 - 99999 之间。 “好”的是,它仅在与另一列组合时必须是唯一的。 我们有组,每个组都有自己的“group_id”,每个组都需要类似 unique
有这个简单的代码: UPDATE counter SET c= c +1 where id = 1; 并且它在开头的 c 字段中为 null 的情况下不起作用。它只有在已经输入了一些数字时才有效,也就
我正在尝试在 python 中构建一个具有闭包属性的计数器。以下工作中的代码: def generate_counter(): CNT = [0] def add_one():
我使用 CSS 来计算 HTML 文档中的部分: body {counter-reset: sect;} section:before { counter-increment: sect;
我是一名优秀的程序员,十分优秀!