首先别的不看,我们就看这个图
看起来非常简单对不对
但经过我长达6个小时的摸索最终失败的经验告诉大家
没有一流的GPU和正确的姿势直接不用尝试

前期准备

1.一台带有桌面Linux系统的主机,如ubuntu 18.04 desktop
2.装了显卡且能够跑CUDA,最好是新一些的显卡,不然后面搞了也跑不起来

3.网络通畅至关重要!!!决定了很多时候你能不能继续往下,要下的内容真的很多。


4.装好了anaconda或者python3.8的环境。前面用的ubuntu18.04默认的python是3.6的,如果默认的python版本改了会影响系统的一系列功能,建议还是装好anaconda。

正文开始

1.拿下代码

git clone https://github.com/microsoft/visual-chatgpt.gitcd visual-chatgpt

2.创建虚拟环境

conda create -n visgpt python=3.8conda activate visgpt

中间可能会提示,直接执行

conda init bash

3.安装依赖的python库

看起来也非常容易,但这里切记要将pip源换成国内的,比如清华源或者阿里云的源,实测阿里源的源下载速度更快,因为下的内容非常多建议用阿里云的源

pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/

换了之后再执行直接速度飙升

pip install -r requirement.txt

4.下载对应的模型

bash download.sh

我们看一下这个脚本

git clone https://github.com/lllyasviel/ControlNet.gitln -s ControlNet/ldm ./ldmln -s ControlNet/cldm ./cldmln -s ControlNet/annotator ./annotatorcd ControlNet/modelswget https://huggingface.co/lllyasviel/ControlNet/resolve/main/models/control_sd15_canny.pthwget https://huggingface.co/lllyasviel/ControlNet/resolve/main/models/control_sd15_depth.pthwget https://huggingface.co/lllyasviel/ControlNet/resolve/main/models/control_sd15_hed.pthwget https://huggingface.co/lllyasviel/ControlNet/resolve/main/models/control_sd15_mlsd.pthwget https://huggingface.co/lllyasviel/ControlNet/resolve/main/models/control_sd15_normal.pthwget https://huggingface.co/lllyasviel/ControlNet/resolve/main/models/control_sd15_openpose.pthwget https://huggingface.co/lllyasviel/ControlNet/resolve/main/models/control_sd15_scribble.pthwget https://huggingface.co/lllyasviel/ControlNet/resolve/main/models/control_sd15_seg.pthcd ../../

git clone大家应该问题不大,但是后面这些wget的文件,每个都有5个多G并且要求你有正确的上网姿势才能拉下来,加起来总共有40多个G。后续阿里云盘上传完成后给大家分享链接

5.如果你非常艰难的过了第四步,恭喜你第五步非常简单

只需要一个openai的key

然后执行命令

export OPENAI_API_KEY={Your_Private_Openai_Key}

6.走到这里你以为结束了吗,没有还有好几百兆的文件要下载

# Start Visual ChatGPT !python visual_chatgpt.py

轻描淡写的几句话,在国内这个网络环境emmm
如果你也非常顺利的下载完了,然后发现你的显卡并不支持
白折腾一通
我就是这么个情况