开发者论坛

全部回复

LV.2 #6 zjunk回复

#5zjunk回复

老师 ，现在我们发现之前catch编译出来在torch/src/catch/torch_mlu/csrc/lib生成的4个动态库分别是libaten_mlu.so  libcatch_python.so libdistributed_mlu.so libjit_mlu.so。由于原始pytorch环境下动态库未更新，我们将/torch/venv3/pytorch/lib/python3.6/site-packages/torch_mlu/csrc/lib下的.so替换成为torch/src/catch/torch_mlu/csrc/lib重新编译后的，我们尝试导入import torch import torch_mlu会出现以下错误：[图片]在更新了/torch/venv3/pytorch/lib/python3.6/site-packages/torch_mlu/csrc/lib的动态库以后他却报错找不到ComputepluginPpyoloenmsOpForward（该函数为自定义算子函数）。现在不知道到底哪儿出了问题希望老师们帮忙看看

展开

已解决

2023-02-23 15:10:02 2| 回复

LV.2 #5 zjunk回复
#1fcam回复
算子没有添加成功，请检查代码。是否“在 catch/torch_mlu/tools/mlu_functions.yaml 中声明”。请按照 Cambricon-PyTorch-User-Guide-CN 文档中，第7张自定义框架操作进行添加，另外可以参考已有的自定义算子比如--Yolov5_Detection_Output
展开
老师，现在我们发现之前catch编译出来在torch/src/catch/torch_mlu/csrc/lib生成的4个动态库分别是libaten_mlu.so libcatch_python.so libdistributed_mlu.so libjit_mlu.so。由于原始pytorch环境下动态库未更新，我们将/torch/venv3/pytorch/lib/python3.6/site-packages/torch_mlu/csrc/lib下的.so替换成为torch/src/catch/torch_mlu/csrc/lib重新编译后的，我们尝试导入import torch import torch_mlu会出现以下错误：
在更新了/torch/venv3/pytorch/lib/python3.6/site-packages/torch_mlu/csrc/lib的动态库以后他却报错找不到ComputepluginPpyoloenmsOpForward（该函数为自定义算子函数）。现在不知道到底哪儿出了问题希望老师们帮忙看看
2023-02-20 17:38:01 0| 回复
LV.2 #4 zjunk回复
#3fcam回复
你完整的添加流程是怎样的？“1.在torch_mlu/tools/mlu_functions.yaml注册这个文件包含了代码生成需要的所有信息，一共需要name,use_mlu_dispatcher,derived_type,schema_string,arguments,return_type六个标记2.在torch_mlu/csrc/aten/operators/op_methods.cpp增加CPU的函数体这个文件目前不能自动生成，仍旧需要手动添加3.在torch_mlu/csrc/aten/operators/cnml/或者torch_mlu/csrc/aten/operators/cnnl/下添加实现cnml_kernel.h以及cnnl_kernel.h已经自动生成了，根据这两个头文件中的声明写xxx.cpp，再在internal文件夹下添加xxx_internal.cpp以及cnml_internal.h（或者cnnl_internal.h），以上3个步骤即可完成算子的注册”
展开
老师这是我的以下步骤：
第一步在torch_mlu/tools/mlu_functions.yaml中声明mlunmsthresh
第二步在torch_mlu/csrc/aten/operators/中op_methods.h与op_methods.cpp进行算子声明与CPU实现如下所示：
2.1op_methods.h声明：
virtual at::Tensor mlunmsthresh(const at::Tensor & source, int64_t num_classes, int64_t num_anchors);
如下所示
2.2op_methods.cpp实现：
第三步在torch_mlu/csrc/aten/operators/cnml中cnml_kernel.h声明与实现。在子目录internal下的声明与实现
3.1在cnml_kernel.h声明
at::Tensor cnml_mlunmsthresh(const at::Tensor & source, int64_t num_classes, int64_t num_anchors);

如下所示：
3.2在torch_mlu/csrc/aten/operators/cnml/mlunmsthresh.cpp进行实现cnml_mlunmsthresh
如下所示：
3.3在torch_mlu/csrc/aten/operators/cnml/internal/cnml_internal.h声明
at::Tensor cnml_mlunmsthresh(const at::Tensor & source, int64_t num_classes, int64_t num_anchors);
如下所示：
3.4torch_mlu/csrc/aten/operators/cnml/inernal/mlunmsthresh_internal.cpp实现
at::Tensor cnml_mlunmsthresh_internal(const at::Tensor & source,int64_t num_classes, int64_t num_anchors)
如下所示：
第四步完成编写返回/catch目录下执行 python setup.py install 重新编译catch

以上就是我的所有完整的添加流程步骤。老师但是在调用
detect_out = torch.ops.torch_mlu.mlunmsthresh(score,80,8400)
测试还是出现出现（找不到该算子操作）

1
2023-02-17 16:01:27 0| 回复
LV.1 #3 fcam回复

你完整的添加流程是怎样的？
“
1.在torch_mlu/tools/mlu_functions.yaml注册
这个文件包含了代码生成需要的所有信息，一共需要name,use_mlu_dispatcher,derived_type,schema_string,arguments,return_type六个标记
2.在torch_mlu/csrc/aten/operators/op_methods.cpp增加CPU的函数体
这个文件目前不能自动生成，仍旧需要手动添加
3.在torch_mlu/csrc/aten/operators/cnml/或者torch_mlu/csrc/aten/operators/cnnl/下添加实现
cnml_kernel.h以及cnnl_kernel.h已经自动生成了，根据这两个头文件中的声明写xxx.cpp，再在internal文件夹下添加xxx_internal.cpp以及cnml_internal.h（或者cnnl_internal.h），以上3个步骤即可完成算子的注册

”

2023-02-17 15:32:22 0| 回复
LV.2 #2 zjunk回复

老师我在catch/torch_mlu/tools/mlu_functions.yaml 中声明过了。如下所示：

2023-02-17 10:24:52 0| 回复
LV.1 #1 fcam回复

算子没有添加成功，请检查代码。是否“在 catch/torch_mlu/tools/mlu_functions.yaml 中声明”。请按照 Cambricon-PyTorch-User-Guide-CN 文档中，第7张自定义框架操作进行添加，另外可以参考已有的自定义算子比如--Yolov5_Detection_Output

2023-02-16 19:17:31 0| 回复

请登录后评论

1.在torch_mlu/tools/mlu_functions.yaml注册

2.在torch_mlu/csrc/aten/operators/op_methods.cpp增加CPU的函数体

3.在torch_mlu/csrc/aten/operators/cnml/或者torch_mlu/csrc/aten/operators/cnnl/下添加实现