OH_NN_QuantParam
概述
量化信息。
在量化的场景中,32位浮点型数据根据以下公式量化为定点数据:
其中s和z是量化参数,在OH_NN_QuanParam中通过scale和zeroPoint保存,r是浮点数,q是量化后的结果,q_min是量化后下界,q_max是量化后的上界,计算方式如下:
clamp函数定义如下:
起始版本: 9
弃用: 从API version 11开始,此接口废弃。
替代: 推荐使用NN_QuantParam。
相关模块: NeuralNeworkRuntime
汇总
成员变量
名称 | 描述 |
---|---|
quantCount | 指定numBits、scale和zeroPoint数组的长度。在per-layer量化的场景下,quantCount通常指定为1,即一个张量所有通道 共享一套量化参数;在per-channel量化场景下,quantCount通常和张量通道数一致,每个通道使用自己的量化参数。 |
numBits | 量化位数 |
scale | 指向量化公式中scale数据的指针 |
zeroPoint | 指向量化公式中zero point数据的指针 |
结构体成员变量说明
numBits
const uint32_t* OH_NN_QuantParam::numBits
描述
量化位数
quantCount
uint32_t OH_NN_QuantParam::quantCount
描述
指定numBits、scale和zeroPoint数组的长度。在per-layer量化的场景下,quantCount通常指定为1,即一个张量所有通道 共享一套量化参数;在per-channel量化场景下,quantCount通常和张量通道数一致,每个通道使用自己的量化参数。
scale
const double* OH_NN_QuantParam::scale
描述
指向量化公式中scale数据的指针
zeroPoint
const int32_t* OH_NN_QuantParam::zeroPoint
描述
指向量化公式中zero point数据的指针