开发者论坛

全部回复

LV.1 #15 FrostLee回复

#14含含回复

1. 关于.data， .data是早期torch的用法，.data和.detach()框架内部的运算是不一样的2. 生成的离线模型会包括运行指令，会比.pt 大一些

展开

感谢感谢。

2023-02-01 18:08:23 1| 回复

LV.2 #14 含含回复
#13FrostLee回复
按你说的修改，或者把“.data”去掉就能转换成功了，这是为什么？另外，转换完的.cambricon为啥比原来的.pt文件还大？
展开
1. 关于.data， .data是早期torch的用法，.data和.detach()框架内部的运算是不一样的
2. 生成的离线模型会包括运行指令，会比.pt 大一些
2023-01-31 16:20:57 2| 回复

LV.1 #13 FrostLee回复

#12含含回复

可以尝试修改下代码将.data 更换成.detach：diff --git a/module/shufflenetv2.py b/module/shufflenetv2.pyindex 89d0eb7..80cd875 100644--- a/module/shufflenetv2.py+++ b/module/shufflenetv2.py@@ -54,7 +54,8 @@ class ShuffleV2Block(nn.Module):             return torch.cat((self.branch_proj(x_proj), self.branch_main(x)), 1)      def channel_shuffle(self, x):-        batchsize, num_channels, height, width = x.data.size()+        #batchsize, num_channels, height, width = x.data.size()+        batchsize, num_channels, height, width = x.detach().size()         assert (num_channels % 4 == 0)         x = x.reshape(batchsize * num_channels // 2, 2, height * width)         x = x.permute(1, 0, 2)

展开

按你说的修改，或者把“.data”去掉就能转换成功了，这是为什么？

另外，转换完的.cambricon为啥比原来的.pt文件还大？

2023-01-10 17:54:14 0| 回复

LV.2 #12 含含回复
#10FrostLee回复
我看到社区挺多模型转换错误的帖子，都没有解决方案......建议大佬们合力看看，总不能只用yolo吧。
可以尝试修改下代码将.data 更换成.detach：
diff --git a/module/shufflenetv2.py b/module/shufflenetv2.py
index 89d0eb7..80cd875 100644
--- a/module/shufflenetv2.py
+++ b/module/shufflenetv2.py
@@ -54,7 +54,8 @@ class ShuffleV2Block(nn.Module):
return torch.cat((self.branch_proj(x_proj), self.branch_main(x)), 1)

def channel_shuffle(self, x):
- batchsize, num_channels, height, width = x.data.size()
+ #batchsize, num_channels, height, width = x.data.size()
+ batchsize, num_channels, height, width = x.detach().size()
assert (num_channels % 4 == 0)
x = x.reshape(batchsize * num_channels // 2, 2, height * width)
x = x.permute(1, 0, 2)
2023-01-04 14:24:36 0| 回复
LV.1 #11 FrostLee回复
#9含含回复
有卡调测会方便很多
再问一下，MLU220能不能支持插卡调试呢？
2023-01-04 10:28:32 0| 回复
LV.1 #10 FrostLee回复
#9含含回复
有卡调测会方便很多
我看到社区挺多模型转换错误的帖子，都没有解决方案......建议大佬们合力看看，总不能只用yolo吧。
2023-01-03 09:40:36 0| 回复

LV.2 #9 含含回复

#8FrostLee回复

OK，明白你意思，但是估计不行，盒子都是成品，除非拆盒子拆里面的卡。还有其他调试方式吗？

有卡调测会方便很多

2022-12-30 18:07:34 0| 回复

LV.1 #8 FrostLee回复

#7含含回复

不需要在220 edge测部署docker框架，您可以在x86主机端部署开发环境（可以插MLU270/MLU220-M2卡），这样调试起来更方便。去掉ct.set_device(-1)，这个网络可以生成220 的离线模型

展开

OK，明白你意思，但是估计不行，盒子都是成品，除非拆盒子拆里面的卡。还有其他调试方式吗？

2022-12-29 21:57:33 0| 回复

LV.2 #7 含含回复
#6FrostLee回复
我觉得不是这样，因为所有的demo都是在docker里面转换，然后copy到MLU220平台上运行的，毕竟边缘盒子存储小，环境都不一定搭得起来，这也是离线推理存在的意义吧。
展开
不需要在220 edge测部署docker框架，您可以在x86主机端部署开发环境（可以插MLU270/MLU220-M2卡），这样调试起来更方便。
去掉ct.set_device(-1)，这个网络可以生成220 的离线模型
2022-12-29 17:53:55 0| 回复
LV.1 #6 FrostLee回复
#5含含回复
从日志看是因为没有设备导致的，去掉ct.set_device(-1) ，建议基于有MLU200的设备的环境进行模型验证和转换
展开
我觉得不是这样，因为所有的demo都是在docker里面转换，然后copy到MLU220平台上运行的，毕竟边缘盒子存储小，环境都不一定搭得起来，这也是离线推理存在的意义吧。
2022-12-29 16:12:30 0| 回复

LV.2 #5 含含回复

#1FrostLee回复

模型转换代码如下：def mlu_forward(modelfile):    ct.set_core_version("MLU220")    ct.set_device(-1)    ct.set_input_format(order)    ct.set_core_number(4) # set core number    device = ct.mlu_device()       with torch.no_grad():        model = Detector(1, True)        model.eval().float()        model = mlu_quantize.quantize_dynamic_mlu(model)        model.load_state_dict(torch.load(modelfile))                ct.save_as_cambricon('fastestdet')        example_tensor = torch.randn((1, 3, 640, 640), dtype=torch.float).to(device)        fusion_model = torch.jit.trace(model.to(device), example_tensor, check_trace=False)        fusion_model(example_tensor)        ct.save_as_cambricon('') # generate offline model        print('fusion success')

展开

从日志看是因为没有设备导致的，去掉ct.set_device(-1) ，建议基于有MLU200的设备的环境进行模型验证和转换

2022-12-29 10:40:12 0| 回复

LV.1 #4 FrostLee回复
#3xiedong2022回复
您好，看log不止一个错误。请先检查一下量化部分的代码。
量化代码如下：
def quantification(weight, offline, img_path, img_size, save_path):
with torch.no_grad():
ckpt = torch.load(weight)
state_dict = ckpt['model'] if 'model' in ckpt else ckpt
model = Detector(1, True)
model.load_state_dict(state_dict)
model.eval().float()

model = mlu_quantize.quantize_dynamic_mlu(model,
{ 'iteration':1000,
'mean': mean,
'std': std,
'data_scale':1.0,
'firstconv': True,
'perchannel':True,
'use_avg':False }, dtype='int8', gen_quant=True)
calibration(model = model, dir = img_path, img_size = img_size)

torch.save(model.state_dict(), save_path)
print(save_path, " save over")
2022-12-28 21:34:06 0| 回复
LV.1 #3 xiedong2022回复

您好，看log不止一个错误。请先检查一下量化部分的代码。

2022-12-28 17:27:32 0| 回复
LV.1 #2 FrostLee回复

模型代码如下：
https://github.com/dog-qiuqiu/FastestDet

2022-12-27 19:13:23 0| 回复
LV.1 #1 FrostLee回复

模型转换代码如下：
def mlu_forward(modelfile):
ct.set_core_version("MLU220")
ct.set_device(-1)
ct.set_input_format(order)
ct.set_core_number(4) # set core number
device = ct.mlu_device()

with torch.no_grad():
model = Detector(1, True)
model.eval().float()

model = mlu_quantize.quantize_dynamic_mlu(model)
model.load_state_dict(torch.load(modelfile))

ct.save_as_cambricon('fastestdet')
example_tensor = torch.randn((1, 3, 640, 640), dtype=torch.float).to(device)
fusion_model = torch.jit.trace(model.to(device), example_tensor, check_trace=False)
fusion_model(example_tensor)
ct.save_as_cambricon('') # generate offline model
print('fusion success')

2022-12-27 19:10:06 0| 回复

请登录后评论