开发者论坛

全部回复

LV.1 #3 Alex回复

nnlQuantizeV1和cnnlQuantizeV2的作用都是根据调用算子时传入的量化参数将输入数据量化成用户指定的输出类型。之所以一个输出需要调用cnnlSetTensorDescriptorPosition(等一类设置量化参数的接口)，一个不需要，主要是两个接口支持的使用场景不同。
cnnlQuantizeV1接口只支持从host端传量化参数，即需要调用者提前现在host端准备好量化参数，然后通过output_desc传到算子里，再参与计算，cnnlQuantizeV1大多适用已经准备好量化参数的推理场景。
cnnlQuantizeV2接口只支持从MLU设备端传量化参数，即需要调用者提前在MLU设备端准备好量化参数，然后把量化参数的地址传给V2接口。cnnlQuantizeV2大多适用于训练场景，配合cnnlQuantizeParam接口使用。先调用cnnlQuantizeParam接口算出量化参数，此时量化参数存在ＭＬＵ设备端。如果接下来调用cnnlQuantizeV1接口，需要做一次MLU设备端到host端的拷贝，会打断host端和MLU端的并行，影响性能。
其实示例代码的一开始有简要的注释说明：
* quantize_v1_test */
/* * A test which shows how to run quantize op when quantization parameters * are inputted from host.

/* quantize_v2_test */
/* * A test which shows how to run quantize op when quantization parameters * are inputted from MLU device.

2023-07-10 11:38:32 1| 回复
LV.2 #2 刘好念回复

我修改一下：
经过实验测试 cnnlQuantizeV2 函数的输入参数中尽管有 Input_desc 和 output_desc 参数，但是该函数执行之后并不会修改 output_desc 的 position/scale/offset 数据。
在CNNL 用户手册中的“量化示例代码”部分使用 cnnlQuantizeV2 进行数据量化时并没调用 cnnlSetTensorDescriptorPosition 函数，而在使用cnnlQuantizeV1进行量化的示例代码中却有，这是为什么呢？
这样会给人（我这样的小白）一种使用 cnnlQuantizeV2 就无需进行手动设置 output_desc 的positon/scale/offset 等数据的错觉。
麻烦官方文档维护人员给我一个胶带！！！

2023-07-07 13:51:03 0| 回复
LV.1 #1 sunky回复

您好，感谢您的宝贵意见，我们会尽快给出答复。

2023-07-07 11:32:02 0| 回复

请登录后评论