OH_NN_QuantParam

概述

量化信息。

在量化的场景中,32位浮点型数据根据以下公式量化为定点数据:

zh-cn_formulaimage_0000001405137102

其中s和z是量化参数,在OH_NN_QuanParam中通过scale和zeroPoint保存,r是浮点数,q是量化后的结果,q_min是量化后下界,q_max是量化后的上界,计算方式如下:

zh-cn_formulaimage_0000001459019845

zh-cn_formulaimage_0000001408820090

clamp函数定义如下:

zh-cn_formulaimage_0000001455538697

起始版本:

9

相关模块:

NeuralNeworkRuntime

汇总

成员变量

成员变量名称 描述
quantCount 指定numBits、scale和zeroPoint数组的长度。
在per-layer量化的场景下,quantCount通常指定为1,即一个张量所有通道共享一套量化参数;在per-channel量化场景下,quantCount通常和张量通道数一致,每个通道使用自己的量化参数。
numBits 量化位数。
scale 指向量化公式中量化参数s的指针。
zeroPoint 指向量化公式中量化参数z的指针。

结构体成员变量说明

numBits

const uint32_t* OH_NN_QuantParam::numBits

描述:

量化位数。

quantCount

uint32_t OH_NN_QuantParam::quantCount

描述:

指定numBits、scale和zeroPoint数组的长度。

在per-layer量化的场景下,quantCount通常指定为1,即一个张量所有通道 共享一套量化参数;在per-channel量化场景下,quantCount通常和张量通道数一致,每个通道使用自己的量化参数。

scale

const double* OH_NN_QuantParam::scale

描述:

指向量化公式中scale数据的指针。

zeroPoint

const int32_t* OH_NN_QuantParam::zeroPoint

描述:

指向量化公式中zero point数据的指针。