python - Onnx模型的量化-6ren

python - Onnx模型的量化

转载作者：行者123 更新时间：2023-12-04 10:54:44

34

4

我正在尝试使用 onnxruntime quantization tool 量化 ONNX 模型.

我的量化代码如下:

import onnx
from quantize import quantize, QuantizationMode

# Load the onnx model     
model = onnx.load('3ddfa_optimized_withoutflatten.onnx')

# Quantize
quantized_model = quantize(model, quantization_mode=QuantizationMode.IntegerOps)
 
# Save the quantized model
onnx.save(quantized_model, 'quantized_model.onnx')

采用这种方法后，我得到的模型具有 0 维模型。我必须在量化函数中传递哪些参数才能获得合适的模型？

最佳答案

除非你共享 onnx 模型，否则很难说出原因。

对于 OnnxRuntime 1.4.0，您可以尝试以下操作:

    quantized_model = quantize(onnx_opt_model,
                               quantization_mode=QuantizationMode.IntegerOps,
                               symmetric_weight=True,
                               force_fusions=True)

如果问题仍然存在，请分享您的onnx模型，以便我们查看。

关于python - Onnx模型的量化，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59285549/

34

4

0

文章推荐： reactjs - 无法创建新的 reactJs 应用程序

文章推荐： r - 使用 prob 包计算 R 中的条件概率

pytorch - 尝试将双线性层转换为 onnx 时，上采样 ONNX 给出 INVALID_GRAPH
当我将在 Pytorch 上训练的双线性层网络转换为 ONNX 时，出现以下错误 RuntimeError: [ONNXRuntimeError] : 10 : INVALID_GRAPH : Loa
pytorch - 尝试将双线性层转换为 onnx 时，上采样 ONNX 给出 INVALID_GRAPH
当我将在 Pytorch 上训练的双线性层网络转换为 ONNX 时，出现以下错误 RuntimeError: [ONNXRuntimeError] : 10 : INVALID_GRAPH : Loa
pytorch - 对象检测模型 (PyTorch) 到 ONNX :empty output by ONNX inference
我尝试将我的 PyTorch 对象检测模型 (Faster R-CNN) 转换为 ONNX。我有两个设置。第一个工作正常，但出于部署原因我想使用第二个。区别在于我用于导出函数 torch.onnx.e
python - 使用 C++ 解析 ONNX 模型。使用 C++ 从 onnx 模型中提取层、输入和输出形状
我正在尝试从 onnx 模型中提取输入层、输出层及其形状等数据。我知道有 python 接口(interface)可以做到这一点。我想做类似的事情 code但在 C++ 中。我还粘贴了链接中的代码。我
ONNX Runtime介绍
** ONNX Runtime****：由微软推出，用于优化和加速机器学习推理和训练**，适用于ONNX模型，是一个跨平台推理和训练机器学习加速器(ONNX Runtime is a cro
python - 如何从 ONNX 模型获取输入数据？
我已将我的 PyTorch 模型导出到 ONNX。现在，有没有办法让我从那个 ONNX 模型中获取输入层？将 PyTorch 模型导出到 ONNX import torch.onnx checkpo
python - 从 onnx 文件中查找输入形状
如何找到 onnx 模型的输入大小？我最终想从 python 编写它的脚本。使用 tensorflow 我可以恢复图定义，从中找到输入候选节点，然后获取它们的大小。我可以用 ONNX(甚至更简单)做
c# - 无法使 ONNX 模型的输入列名称起作用
我正在使用 ML.NET 导入 ONNX 模型来进行对象检测。作为记录，我从 Microsoft 的 CustomVision.ai 站点导出了模型。我检查了 Netron 中的模型文件，它清楚地显
protocol-buffers - 如何从 ONNX 模型中读取各个层的权重和偏差值？
如何从 ONNX 模型中获取权重/偏置矩阵值，我目前可以从 model.onnx 中获取输入、内核大小、步幅和填充值。我加载模型，然后读取图形节点以获得相同的结果: import onnx m = o
pytorch - 无法将 PyTorch 模型导出到 ONNX
我正在尝试将预先训练好的火炬模型转换为 ONNX，但收到以下错误: RuntimeError: step!=1 is currently not supported 我正在一个预先训练的着色模型上尝试
onnxruntime - 如何在 ONNX Runtime 中实现多线程？
使用 ONNX Runtime 在深度学习模型上运行推理。假设我有 4 个不同的模型，每个模型都有自己的输入图像，我可以在 4 个线程中并行运行它们吗？会不会有一个“环境”，然后是 4 个 sessi
tensorflow - 你如何将 .onnx 转换为 tflite？
我已通过以下方式将模型导出到 ONNX: # Export the model torch_out = torch.onnx._export(learn.model, # mo
python - Onnx 模型输入大小与 Opencv 帧大小不同
如何将 OpenCV 框架转换为适合我的 ONNX 模型接受的尺寸？目前，我的 ONNX 模型输入形状是 [32, 3, 256, 224]，但是当我使用 OPENCV 调整大小并打印 img 形状时
pytorch - ONNX 和 pytorch 的输出不同
我尝试将我的 pytorch Resnet50 模型转换为 ONNX 并进行推理。转换程序没有错误，但是onnx模型的最终结果来自onnxruntime与pytorch的origin模型结果有较大差距
python - 将卡住图从 .pb 转换为 .onnx
我有一个卡住为 .pb 的 TensorFlow 图，我想将其转换为 .onnx 格式。我目前正在尝试使用 mmconvert (来自 Microsoft 的 MMdnn )，显然我做错了什么(请参见
python - Tensorflow 到 ONNX 的转换
我目前正在尝试将我使用本教程创建的已保存(且正在工作)的 .pb 文件 ( https://github.com/thtrieu/darkflow ) 转换为 onnx 文件。我现在正在使用winML
deep-learning - 将具有多个网络的 pytorch 模型转换为 onnx
我正在尝试将具有多个网络的 pytorch 模型转换为 ONNX，但遇到了一些问题。 git 存储库:https://github.com/InterDigitalInc/HRFAE 训练师类: cl
tensorflow - 无法将 .h5 模型转换为 ONNX 以通过任何方式进行推理
我从 Matterport's MaskRCNN implementation 在 .h5 中构建了一个自定义模型.我使用 model.keras_model.save() 设法保存了完整模型而不是单
python - 从 Python 中的 ONNX 模型获取预测
我找不到任何人向外行人解释如何将 onnx 模型加载到 python 脚本中，然后在输入图像时使用该模型进行预测。我能找到的只有这些代码行: sess = rt.InferenceSession("o
python - 在 Python 中并行运行多个 ONNX 模型进行推理
有没有办法并行运行多个 ONNX 模型并使用多个可用内核？目前，我已经训练了两个 ONNX 模型并想使用它们进行推断。我使用了 Python 中的线程，但这并没有真正使用多核。之后，我尝试了多处理

首页

博学

6Ren·AI

商城

python - Onnx模型的量化