作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试分析 TensorFlow 的计算/内存使用情况,发现 tfprof是我的目的的正确工具。但是,我无法获得所有运营商的 FLOPS。
以下是我在 TensorFlow 存储库 (tensorflow/models/image/cifar10/cifar10_train.py) 中使用 cifar10 教程按照 tfprof 教程所做的操作:
run_metadata = tf.RunMetadata()
_, loss_value = sess.run([train_op, loss],
options=tf.RunOptions(trace_level=tf.RunOptions.FULL_TRACE),
run_metadata=run_metadata)
op_log = tfprof_log_pb2.OpLog()
// TODO: add op information
tf.contrib.tfprof.tfprof_logger.write_op_log(
tf.get_default_graph(),
log_dir="/tmp/log_dir",
op_log=op_log,
run_meta=run_metadata)
tf.contrib.tfprof.model_analyzer.print_model_analysis(
tf.get_default_graph(),
run_metadata=run_metadata,
op_log=op_log,
tfprof_options=tf.contrib.tfprof.model_analyzer.FLOAT_OPS_OPTIONS)
Parsing GraphDef...
Parsing RunMetadata...
Parsing OpLog...
Preparing Views...
=========================Options=============================
-max_depth 10000
-min_bytes 0
-min_micros 0
-min_params 0
-min_float_ops 1
-device_regexes .*
-order_by float_ops
-account_type_regexes .*
-start_name_regexes .*
-trim_name_regexes
-show_name_regexes .*
-hide_name_regexes
-account_displayed_op_only true
-select float_ops
-viz false
-dump_to_file
==================Model Analysis Report======================
_TFProfRoot (0/5.23b flops)
conv2/Conv2D (3.77b/3.77b flops)
conv1/Conv2D (707.79m/707.79m flops)
gradients/local3/MatMul_grad/MatMul (226.49m/226.49m flops)
gradients/local3/MatMul_grad/MatMul_1 (226.49m/226.49m flops)
local3/MatMul (226.49m/226.49m flops)
gradients/local4/MatMul_grad/MatMul (18.87m/18.87m flops)
gradients/local4/MatMul_grad/MatMul_1 (18.87m/18.87m flops)
local4/MatMul (18.87m/18.87m flops)
conv1/BiasAdd (4.72m/4.72m flops)
conv2/BiasAdd (1.18m/1.18m flops)
gradients/softmax_linear/MatMul_grad/MatMul (491.52k/491.52k flops)
gradients/softmax_linear/MatMul_grad/MatMul_1 (491.52k/491.52k flops)
softmax_linear/MatMul (491.52k/491.52k flops)
======================End of Report==========================
OpLog
(见上面的代码)。
最佳答案
您是对的,其他运算符(operator)在没有 RegisterStatistics('flops') 之前没有 flops。欢迎您做出贡献。
我不确定 NVIDA 是否有工具。
关于tensorflow - 使用 tfprof 分析 TensorFlow,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42309202/
我想使用 tfprof 分析我的 tensorflow 应用程序。我正在运行 TensorFlow 1.3 安装,其中缺少 tfprof 命令行工具。我也在本地尝试了提供的 pip 包,但在那里我也找
我正在尝试分析 TensorFlow 的计算/内存使用情况,发现 tfprof是我的目的的正确工具。但是,我无法获得所有运营商的 FLOPS。 以下是我在 TensorFlow 存储库 (tensor
我是一名优秀的程序员,十分优秀!