RuntimeError: FlashAttention is only supported on CUDA 11 and above
- 问题描述
- 解决方案
问题描述
RuntimeError: FlashAttention is only supported on CUDA 11 and above
解决方案
此错误的原因可能是 nvcc 的 CUDA 版本(通过键入“nvcc -V”获得,可能 < 11.0)与 torch (11.7) 的 CUDA 版本不匹配。
类似问题在这里解决:
https://stackoverflow.com/questions/40517083/multiple-cuda-versions-on-machine-nvcc-v-confusion
我解决了这个问题通过:
首先:
vim ~/.bashrc
在最后一行加上:
export PATH=/usr/local/cuda-11.7/bin:$PATH
然后:
source ~/.bashrc
注意这里的cuda-11.7需要依据自己电脑或者服务器上面的版本来改,找到/usr/local目录下来看。改成自己需要的版本。
感谢:
参考1
的haoychen3
的帮助。