用了autodl上的镜像:CrazyBoyM/dreambooth-for-diffusion/dreambooth-for-diffusion:v3,在无卡模式下调试代码到时候,因为没有Cuda支持,无法使用半精度VAE模块进行推理,因此在获取latent图像时出现报错:
"slow_conv2d_cpu" not implemented for 'Half'
解决方案:
参考python – “RuntimeError: “slow_conv2d_cpu” not implemented for ‘Half'” – Stack Overflow
既然无法使用half精度,那就不进行转换。找到train_dreambooth.py文件的611-665行:
weight_dtype = torch.float32if args.mixed_precision == "fp16":weight_dtype = torch.float16elif args.mixed_precision == "bf16":weight_dtype = torch.bfloat16
注释掉转换half精度的代码,使用float32精度。
再重新运行VAE的encoder,就不会再报错了。