Tensorflow - 推理时间评估-6ren

Tensorflow - 推理时间评估

转载作者：行者123 更新时间：2023-12-02 20:31:48

30

4

我正在使用 Tensorflow 评估不同的图像分类模型，特别是使用不同设备的推理时间。我想知道我是否必须使用预训练模型。我正在使用生成 1000 张随机输入图像的脚本，将它们一张一张地馈送到网络，并计算平均推理时间。

谢谢!

最佳答案

让我先警告一下:

大多数人以错误的方式完成了神经网络的正确基准测试。对于 GPU，有磁盘 I/O、内存带宽、PCI 带宽和 GPU 速度本身。然后存在实现错误，例如在 TensorFlow 中使用 feed_dict。对于这些模型的高效训练也是如此。

让我们从一个考虑 GPU 的简单示例开始

import tensorflow as tf
import numpy as np

data = np.arange(9 * 1).reshape(1, 9).astype(np.float32)
data = tf.constant(data, name='data')

activation = tf.layers.dense(data, 10, name='fc')

with tf.Session(config=tf.ConfigProto(log_device_placement=True)) as sess:
    sess.run(tf.global_variables_initializer())
    print sess.run(activation)

它所做的只是创建一个常量张量并应用一个全连接层。所有操作都放在GPU上:

fc/bias: (VariableV2): /job:localhost/replica:0/task:0/device:GPU:0
2018-01-25 09:55:01.587959: I tensorflow/core/common_runtime/placer.cc:874] fc/bias: (VariableV2)/job:localhost/replica:0/task:0/device:GPU:0
fc/bias/read: (Identity): /job:localhost/replica:0/task:0/device:GPU:0
2018-01-25 09:55:01.587970: I tensorflow/core/common_runtime/placer.cc:874] fc/bias/read: (Identity)/job:localhost/replica:0/task:0/device:GPU:0
fc/bias/Assign: (Assign): /job:localhost/replica:0/task:0/device:GPU:0
2018-01-25 09:55:01.587979: I tensorflow/core/common_runtime/placer.cc:874] fc/bias/Assign: (Assign)/job:localhost/replica:0/task:0/device:GPU:0
fc/kernel: (VariableV2): /job:localhost/replica:0/task:0/device:GPU:0
2018-01-25 09:55:01.587988: I tensorflow/core/common_runtime/placer.cc:874] fc/kernel: (VariableV2)/job:localhost/replica:0/task:0/device:GPU:0
fc/kernel/read: (Identity): /job:localhost/replica:0/task:0/device:GPU:0
...

看起来不错吧？对该图进行基准测试可能会粗略估计 TensorFlow 图的执行速度。只需将 tf.layers.dense 替换为您的网络即可。如果您接受使用 pythons time 包的开销，您就完成了。

但不幸的是，这还不是全部。从张量运算 'fc/BiasAdd:0' 访问设备内存 (GPU) 并将结果复制回主机内存(CPU、RAM)。因此在某些时候存在 PCI 带宽限制。还有一个 python 解释器也在某处，占用 CPU 周期。

此外，操作放置在 GPU 上，而不是值本身。不确定，您使用的是哪个 TF 版本。但即使是 tf.const 也不能保证在旧版本中放置在 GPU 上。我只在编写自己的 Ops 时才注意到这一点。顺便说一句:请参阅我在 how TF decides where to place operations 上的其他答案.

现在，困难的部分是:这取决于您的图表。在某处放置一个 tf.cond/tf.where 会使基准测试变得更加困难。现在，您需要经历所有这些在有效训练深度网络时需要解决的问题。意思是，一个简单的 const 不能解决所有情况。

解决方案从放置/staging 开始一些值通过运行直接进入GPU内存

stager = data_flow_ops.StagingArea([tf.float32])
enqeue_op = stager.put([dummy])
dequeue_op = tf.reduce_sum(stager.get())

for i in range(1000):
    sess.run(enqeue_op)

事先。但同样，TF 资源管理器正在决定它把值放在哪里(并且不能保证排序或丢弃/保留值)。

总结一下:基准测试是一项非常复杂的任务，因为基准测试 CUDA 代码非常复杂。现在，您拥有 CUDA 和 python 部分。这是一个非常主观的任务，取决于您对哪些部分感兴趣(只是图形，包括磁盘 i/o，...)

我通常使用示例中的 tf.const 输入运行图形，并使用 profiler查看图中发生了什么。

有关如何提高运行时性能的一些一般想法，您可能需要阅读 Tensorflow Performance Guide

关于Tensorflow - 推理时间评估，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/48438245/

30

4

0

文章推荐： c# - 使用 C# 连接到 Firefox

文章推荐： javascript - 附加文本立即消失

文章推荐： c# - 找不到 Rx Dump() 方法

文章推荐： cron - Certbot:打包的自动续订 cron 作业在哪里？

Makefile变量扩展/评估
目前，由于生成变量的评估，我的Makefile遇到了问题。我降低了复杂性，仅保留了导致问题的基本要素。读取Makefile时， $(LIST)被评估为文件列表。在步骤1中，其中一个文件被删除。在
JavaScript 评估
为什么这 eval 没有调用alert("Summer") ？ eval('(caption="Summer";alert(caption))'); 和《夏天》里的台词有关系吗？最佳答案 Uncau
JavaScript 评估
我正在努力让以下工作正常进行。最初似乎可以工作，但不知何故它停止工作了 var setCommonAttr = "1_row1_common"; var val = document.getEleme
javascript 评估
eval('({"suc":true})') 以上错误，应该是: eval('{"suc":true}') 为什么？最佳答案当尝试评估时，解释器会看到大括号并认为它是一个 block 开头。将其括
JavaScript 评估
我的页面 A 发出了 ajax 调用并引入了片段 B。该片段被添加到 DOM 中，并且该片段中的所有脚本都经过了评估。在该代码片段中，我有 2 个脚本标签: function doOptions()
javascript && 评估
这里是javascript代码: var test = { "h" : function (a) {return a;}, "say" : "hello" }; 第一次运行: test
PHP 评估 $a ="$a"?
我正在查看一些工作代码，并遇到了这一行: eval("\$element = \"$element\";"); 我真的很困惑为什么任何 PHP 开发人员都会写这一行。除了给自己设置一个变量之外，这还有
Java- && 评估
谁能帮我解决以下问题: 我有这样的代码: if(cond1 && cond2 && .. && cond10) 这里，cond1 是昂贵的操作，其输出是 boolean 值。现在我的问题是，当 co
华为AppCube通过中国信通院“低代码开发平台通用能力要求”评估
**摘要：**华为AppCube应用魔方顺利通过信通院评估，被认证为具备 “低代码开发平台通用能力”的企业服务平台。本文分享自华为云社区《华为AppCube通过中国信通院“低代码开发平台通用能力要求
php - 评估()不工作？
我正在尝试通过 PHP 从图像的 EXIF 数据中获取焦距。这是我目前得到的代码: $exif = exif_read_data("$photo"); $length10 = $exif['Foca
javascript - Null不是对象(评估
我想使用id =“key”将一个类添加到元素中，但是为什么不起作用？我是js的初学者:这是代码: audio.classList.add('yellow'); 这是错误: null is not an
PHP XPATH 评估
这是我的 XML: QueWay Password Recovery 现在我想用 php 用 xpath 选择文本“QueWay”。到目前为止我所拥有的一切都很好: $xml =
java - If 语句评估
使用下面的代码，即使我输入的数字大于 18，我也会得到这个结果。运行:你今年多大？ 21你还没有达到成年年龄!构建成功(总时间:3 秒) 我是java新手，正在尝试自学，有人可以帮忙吗？ impor
函数参数的 R 评估
我正在阅读 http://www.cran.r-project.org/doc/manuals/R-lang.pdf手册第 4.3 章，我就是不明白。也许有人可以给我一个快速的解释，为什么 R 的行为
c# - IEnumerable 评估
在这个实现中，每次都会评估 hand 并返回另一个列表吗？ foreach (Card card in hand.Cards) { } 我们应该用下面的实现替换上面的实现吗？ var cards =
c# - 评估 LambdaExpression？
我正在制作 LINQ lambda 表达式: Expression> add = (x, y) => x + y; 但现在我将如何评估它，比如说找到 2+3？最佳答案这应该适合你: var su
c++ - 评估 IF 条件的最有效方法是什么？
我正在制作一个语言解释器，我已经到了需要评估 if 语句的地步。起初我认为这很简单，我能够让我的解释器评估简单的 if 条件，10 == 10 但是当我试图让它评估更复杂的条件时， 10 == 10
python - PySpark 评估
我正在尝试以下代码，该代码向 RDD 中的每一行添加一个数字，并使用 PySpark 返回 RDD 列表。 from pyspark.context import SparkContext file
compilation - 评估-何时使用？
在阅读了很多关于 Lisp eval-when 运算符的文档后，我仍然无法理解它的用途，我知道使用这个运算符我可以控制表达式的计算时间，但我做不到找出任何可能适用的示例？最好的问候，utxee. 最
C++ 业务规则表达式解析器/评估
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的，

首页

博学

6Ren·AI

商城

Tensorflow - 推理时间评估