- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我使用 PyTorch 在我的自定义数据集上训练了 YOLO-v3 tiny。为了比较推理时间,我尝试了 CPU 上的 onnxruntime 以及 PyTorch GPU 和 PyTorch CPU。平均运行时间约为:
onnxruntime cpu: 110 ms - CPU 使用率: 60%
Pytorch GPU:50 毫秒
Pytorch CPU:165 毫秒 - CPU 使用率:40%
并且所有模型都使用批量大小 1。
但是,我不明白 onnxruntime 与 PyTorch CPU 相比如何更快,因为我没有使用 onnxruntime 的任何优化选项。我刚刚用过这个:
onnx_model = onnxruntime.InferenceSession('model.onnx')
onnx_model.run(None,{onnx_model.get_inputs()[0].name: input_imgs })
有人可以向我解释一下为什么在没有任何优化的情况下速度更快吗?以及为什么使用 onnxruntime 时 CPU 使用率更高。有什么办法可以让它保持下去吗?
提前致谢。
最佳答案
ONNX 运行时使用静态 ONNX 图,因此它具有图的完整 View ,并且可以进行许多 PyTorch 不可能/更难完成的优化。从某种意义上说,它类似于编译与解释的编程语言实现。
关于gpu - Onnxruntime 与 PyTorch,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67943173/
环境: 中央操作系统 7 python 3.9.5 CUDA:11.4 cudnn: 8.2.4 onnxruntime-gpu: 1.9.0 nvidia 驱动程序:470.82.01 1 个特斯拉
I want to install the onnxruntime pip library but i have this output:我想要安装onnxruntime pip库,但我得到了以
我使用 PyTorch 在我的自定义数据集上训练了 YOLO-v3 tiny。为了比较推理时间,我尝试了 CPU 上的 onnxruntime 以及 PyTorch GPU 和 PyTorch CPU
我使用 PyTorch 在我的自定义数据集上训练了 YOLO-v3 tiny。为了比较推理时间,我尝试了 CPU 上的 onnxruntime 以及 PyTorch GPU 和 PyTorch CPU
我使用 sklearn 创建了一个非常基本的决策树。图书馆。这棵树基于 4 个特征进行训练: feat1 INT feat2 INT feat3 FLOAT feat4 FLOAT 标签/目标特征是一
我正在使用 Microsoft OnnxRuntime 来检测和分类图像中的对象,我想将其应用于实时视频。为此,我必须将每一帧转换为 OnnxRuntime 张量。现在我已经实现了一个大约需要 300
使用 ONNX Runtime 在深度学习模型上运行推理。假设我有 4 个不同的模型,每个模型都有自己的输入图像,我可以在 4 个线程中并行运行它们吗?会不会有一个“环境”,然后是 4 个 sessi
错误:找不到满足 onnxruntime 要求的版本(来自版本:无)错误:找不到 onnxruntime 的匹配分布 最佳答案 您可能正在使用 python 3.10目前(2022 年 6 月)onn
目录 1. 环境配置 1.1 OpenCV DNN 1.2 ONNXRuntime 1.3 Tenso
既然C语言没有半浮点实现,那么如何向ONNXRuntime C API发送数据呢? 最佳答案 可能有一个示例,您可以从此处链接:https://github.com/microsoft/onnxrun
我正在尝试创建一个包含机器学习模型的 Android 应用程序。 我有一个 onnx 模型,以及一个 Python 脚本文件、两个带有标签名称的 json 文件,以及一些用于 mel 谱图计算的 nu
我正在学习一种经过Coco训练的yolov8模型来检测完全不同用例中的对象。当我使用Ultralytics库和内置函数重新加载训练好的模型时,我得到了非常鼓舞人心的性能指标。。然而,我曾尝试将模型导出
我是一名优秀的程序员,十分优秀!