VisCPM适配在寒武纪MLU370板卡上的试用（文生图图生文） - 寒武纪软件开发平台

首页 > 寒武纪开发者论坛>基础软件平台>PyTorch开发>推理 >正文

快速回复

VisCPM适配在寒武纪MLU370板卡上的试用（文生图图生文） jyjyjyjyjy2023-07-28 13:23:59 回复 2 查看 经验交流 社区交流 干货资源

1 赞 0 收藏
分享到:

VisCPM-Chat支持面向图像进行中英双语多模态对话。该模型使用Q-Former作为视觉编码器，使用CPM-Bee（10B）作为语言基座模型，并通过语言建模训练目标融合视觉和语言模型。模型训练包括预训练和指令精调两阶段。

适配链接：https://github.com/OpenBMB/VisCPM
依赖环境：
组件
版本
torch-mlu 1.14.0-torch1.9
torchscale 0.2.0
diffusers 0.20.0.dev0
VisCPM 4974645c786edf

组件	版本
torch-mlu	1.14.0-torch1.9
torchscale	0.2.0
diffusers	0.20.0.dev0
VisCPM	4974645c786edf

测试代码（图生文）：

“黄河之水天上来，奔流到海不复回。” 李白的这句诗可以用来形容这幅图片中的景象：一条汹涌澎湃、波涛汹涌的河流从天而降，撞击着岩石峭壁，形成了令人叹为观止的壮观场面。

适配修改：先使用torch2mlu脚本

问题	解决
accelerate：AttributeError: module 'distutils' has no attribute 'version'	pip uninstall setuptools pip install setuptools==59.5.0
bool问题	--- a/VisCPM/models/cpmbee.py +++ b/VisCPM/models/cpmbee.py @@ -1,4 +1,5 @@ import torch +import torch_mlu from typing import Optional, Tuple, List from typing_extensions import TypedDict @@ -260,7 +261,7 @@ class CPMBeeTorch(torch.nn.Module): attention_mask = attention_mask & sample_mask_2d # length mask mask_1d = present_num_segments != 0 - attention_mask = mask_1d.view(batch, 1, len_buffer) & attention_mask + attention_mask = mask_1d.view(batch, 1, len_buffer) & attention_mask.bool() if hidden_states is None: hidden_states = self.input_ ding(input, input_sub)
Cannot set version_counter for inference tensor	diff --git a/VisCPM/generation/vllm_bee.py b/VisCPM/generation/vllm_bee.py old mode 100644 new mode 100755 index d2820da..e628956 --- a/VisCPM/generation/vllm_bee.py +++ b/VisCPM/generation/vllm_bee.py @@ -1,6 +1,7 @@ from typing import Any, Dict, List, Tuple, Optional import numpy as np import torch +import torch_mlu import torch.nn.functional as F import os @@ -235,7 +236,8 @@ class VLLMCPMBeeGeneration: model_inputs, other_info = self._process_list(data_list, max_inp_length) - with torch.inference_mode(): + with torch.no_grad(): + #with torch.inference_mode(): if vision_hidden_states is None: pixel_values = torch.stack(pixel_values).to(self.device) model_inputs['pixel_values'] = pixel_values
import BMinf报错	实际推理不会用到，注释掉
torch.frombuffer	不加载safetensors类型的hf模型，改成.bin
torch.utils.data 找不到default_collate	xxx/python3.7/site-packages/torch/utils/data/__init__.py from torch.utils.data.dataloader import DataLoader, _DatasetKind, get_worker_info, default_collate

热门帖子

精华帖子

Benchmark Docker 申请流程和使用指南 goodchong 22 回复
Proxmox直通-寒武纪MLU fengyunkai 0 回复
【PyTorch 大模型适配】通义千问在寒武纪MLU370板卡上的试用 jyjyjyjyjy 5 回复
FFMpeg-MLU命令行进行抽帧方法总结博博 2 回复
【PyTorch 大模型移植】CogView2适配 jyjyjyjyjy 0 回复

Github

开发平台

文档中心

新手必读

官方微信