gpt4 book ai didi

python - Onnx模型的量化

转载 作者:行者123 更新时间:2023-12-04 10:54:44 34 4
gpt4 key购买 nike

我正在尝试使用 onnxruntime quantization tool 量化 ONNX 模型.

我的量化代码如下:

import onnx
from quantize import quantize, QuantizationMode

# Load the onnx model
model = onnx.load('3ddfa_optimized_withoutflatten.onnx')

# Quantize
quantized_model = quantize(model, quantization_mode=QuantizationMode.IntegerOps)

# Save the quantized model
onnx.save(quantized_model, 'quantized_model.onnx')

采用这种方法后,我得到的模型具有 0 维模型。我必须在量化函数中传递哪些参数才能获得合适的模型?

最佳答案

除非你共享 onnx 模型,否则很难说出原因。

对于 OnnxRuntime 1.4.0,您可以尝试以下操作:

    quantized_model = quantize(onnx_opt_model,
quantization_mode=QuantizationMode.IntegerOps,
symmetric_weight=True,
force_fusions=True)

如果问题仍然存在,请分享您的onnx模型,以便我们查看。

关于python - Onnx模型的量化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59285549/

34 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com