开发者论坛

全部回复

LV.1 #5 qiuming回复
#4qiuming回复
输入是fp32
你好，根据你们量化经验如果模型特别小，int16量化损失大吗，他与fp16区别在哪，为啥不直接fp16
2023-08-15 10:10:41 0| 回复

LV.1 #4 qiuming回复

#3HelloAI回复

没有相关的例子。如果设置INT16没有改善的话，那可能问题出在非量化算子的部分。输入是FP16还是FP32呢？

展开

输入是fp32

2023-08-15 08:57:08 0| 回复

LV.3 #3 HelloAI回复
#2qiuming回复
你好，我试过INT16的但没啥太大改善，你们有使用量化感知训练模型转正常模型文件部署的例子吗
没有相关的例子。如果设置INT16没有改善的话，那可能问题出在非量化算子的部分。输入是FP16还是FP32呢？
2023-08-04 11:38:41 0| 回复

LV.1 #2 qiuming回复

#1HelloAI回复

INT8精度不够的话，可以试试INT16。另外，量化感知训练产生的模型，如果保存成正常格式的模型文件，也是可以的，这种模型的精度量化后应该损失更小。

展开

你好，我试过INT16的但没啥太大改善，你们有使用量化感知训练模型转正常模型文件部署的例子吗

2023-07-31 19:40:17 0| 回复

请登录后评论