- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
发布Compute Capability 2.0(Fermi)之后,我想知道共享内存是否还有用例。也就是说,什么时候使用共享内存比让L1在后台执行魔术更好?
共享内存是否只是存在于其中,以使为CC <2.0设计的算法无需修改即可高效运行?
为了通过共享内存进行协作,块中的线程将写入共享内存并与__syncthreads()
同步。为什么不简单地(通过L1)写入全局内存并与__threadfence_block()
同步呢?后一种选项应该更容易实现,因为它不必与值的两个不同位置相关联,并且应该更快,因为没有从全局内存到共享内存的显式复制。由于数据被缓存在L1中,因此线程不必等待数据实际将其完全传送到全局内存中。
使用共享内存,可以确保在块的整个过程中都将在那里存放的值保留在那里。这与L1中的值相反,L1中的值如果使用不频繁会被逐出。在任何情况下,最好还是让这种很少使用的数据缓存在共享内存中,而不是让L1根据该算法实际使用的模式来管理它们?
最佳答案
据我所知,GPU中的L1缓存的行为非常类似于CPU中的缓存。因此,您的评论“这与L1中的值相反,如果不经常使用它们将被逐出”对我来说没有多大意义
如果不经常使用L1缓存中的数据,则不会将其驱逐出去。通常,当请求一个以前不在高速缓存中且其地址解析为已在使用中的内存区域的请求时,将其逐出。我不知道NVidia使用的确切的缓存算法,但是假设使用常规的n向关联,则每个内存条目只能基于其地址缓存在整个缓存的一小部分中
我想这也可以回答您的问题。使用共享内存,您可以完全控制存储在何处的内容,而使用缓存时,所有操作都是自动完成的。即使编译器和GPU在优化内存访问方面仍然非常聪明,但有时您仍然可以找到更好的方法,因为您是知道将给出哪些输入以及哪些线程将执行某些操作的人。当然程度)
关于caching - CUDA:什么时候使用共享内存,什么时候依靠L1缓存?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11275744/
可以创建许多内存密集型对象,然后放弃对它们的引用。例如,我可能想从数据库中下载某些数据并对其进行操作,我将进行100次单独的下载和处理迭代。我可以一次声明一个DataTable变量,然后对于每个查询,
当我运行这个查询时,我该怎么做才能做到这一点。 SELECT distinct cus_areacode AS "Area Code", cus_code AS "Number" FROM CUSTO
假设我有一个随机的 zend_db_select 对象。 我如何对该对象进行计数,以便知道满足查询的项目数量。 我尝试了以下方法: $data->TotalRecords = $select->col
我有几个流依赖于在一个流中生成然后传递给另一个流的 session 变量。依赖两个异步流使用的 session 变量是否安全?我想我没有完全理解 mule 应用程序或给定 mule 消息中“sessi
我有一个代表两个用户之间交易的模型,如下所示: class Transaction(models.Model): buyer = models.ForeignKey( Pers
我一直在浏览DeHL repository on GoogleCode ,对我来说看起来真的很好。 许多有趣的功能使基本的编程任务变得更加容易; DotNet FCL 中存在但 Delphi RTL
我正在构建一个包含产品的网站,每个产品都属于一个或多个类别,这些类别可以嵌套在父类别中。我想要 SEO 友好的 URL,如下所示: mysite.com/category/ mysite.com/ca
我有一个超过 7500 万行的 RDD,当我对其调用 count 函数时,我每次都会得到不同的数字。我的理解是 count 应该给出确切的数字。 编辑 只是为了给出数据的概念,结构是这样的 Useri
我想使用以下两个(简化的)表格来计算每个用户访问我的网站的唯一天数: Table: Users +--------------+------------------+ | Field |
我有三个表: users 只有两列:id: INT, name: TEXT houses 三列:id: INT, user_id: INT, sold_at: DATE users_with_hous
我的应用程序偶尔会遇到死锁,因为两个事务需要更新相同的行但顺序不同(例如,事务 A 更新行 X 然后 Y,而事务 B 更新行 Y 然后 X)。 由于各种原因,解决避免此类死锁的传统方法(锁定或以一致的
在这个示例程序中,我使用 strtok_r 将一个字符串拆分为两个标记。 #include #include int main(void) { char buf[] = "Hello Wo
Windows 句柄有时很烦人,要记得在之后进行清理(使用创建的笔和画笔进行 GDI 就是一个很好的例子)。 RAII 解决方案很棒,但是为每种不同类型的 handle 制作一个完整的(五法则)RAI
我了解到 NSUbiquitousKeyValueStore 始终可用,在 no iCloud account 时也是如此已成立。这让我相信我可以安全地将基本数据存储在其中,而无需在 NSUserDe
我正在创建一个新的 DataFrame,其中包含来自 Join 的少量记录。 val joined_df = first_df.join(second_df, first_df.col("key")
我一直在疯狂地创建单元测试,并发现我经常不得不在一个测试中设置一些我刚刚在之前的测试中删除的东西。在一次测试(例如插入测试)中创建某些内容(例如数据库记录)然后将其用于以后的测试(例如删除测试)是否合
我有一个 user_entry 表,其中包含一个date 字段。数据类型是日期时间。数据库是mysql。我想要当前日期和当前月份以及当前日期的所有数据的计数。 我怎样才能得到这个? 我尝试了以下查询,
我正在使用 Rob Conery 的 Massive ORM。 有没有一种优雅的方法来计算返回的记录集? dynamic viewModelExpando = result.ViewData.Mode
在 spark Dataframe 上获得计数的最佳方法是什么? 1) 我试过 count 会添加一个 Action 。但我不想添加额外的操作。 2) 我在 RDD 上使用了累加器,为此数据帧需要转换
我有两个类 Quiz{ String name static hasMany[tags:Tag] } Tag{ String tag } 如何使用标准构建器在 grails 中编写以下
我是一名优秀的程序员,十分优秀!