你应该要在model_q = mlu_quantize.quantize_dynamic_mlu(model)后load下你量化后保存下来的state_dict
是的,但是初始模型不是也有初始权重吗,我也使用了量化
你应该要在model_q = mlu_quantize.quantize_dynamic_mlu(model)
model_q
=
mlu_quantize.quantize_dynamic_mlu(model)
后load下你量化后保存下来的state_dict
220也可以生成离线模型,但是你的代码好像都没有load权值啊,另外,全职要先经过量化的
请登录后评论