n卡驱动+cuda+cudnn避坑详尽过程
ubuntu20.04ok
第一次安装的时候使用的是ubuntu18.04,后来发现还是会报错,索性用20.04,毕竟20.04屏幕看上去舒服漂亮多了。cuda还是装10.1,cudnn7.6.5
显卡驱动安装
我之前用的都是
1 | sudo apt-get install nvidia-driver-418 |
之后会安装成功
还有一种方式是用touchpad
的附加驱动安装
这里选择应用修改即可
但是使用nvidia-smi
会显示
1 | NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver |
这里的报错解决是通过
1 | ll /usr/src/ |
看到驱动是418.211
因此使用
1 | sudo dkms install -m nvidia -v 418.211.00 |
装完之后重启,我还改了bios
以及禁了nouveau驱动
通过
1 | sudo gedit /etc/modprobe.d/blacklist-nouveau.conf |
在文件中添加内容:
1 | blacklist nouveau |
更新后编译
1 | sudo update-initramfs -u |
图形驱动我没敢禁,上次导致电脑崩了
安装cuda
官网下载cuda_10.1.105_418.39_linux.run
然后不要选择driver,因为安装过了,而且大概率会报错
因为ubuntu20.04是gcc版本g++版本比较高,所以要设定不同版本
1 | sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-7 9 |
这里会报错,所以我用了aptitude装依赖
1 | sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++ 9 |
命令行为
1 | sudo aptitude install g++ |
搞定之后装cuda10.1,装完大功告成,失败至少试个三次吧,反正失败的原因不知道,什么都不变化再装就成功了
1 | sudo sh cuda_10.1.243_418.87.00_linux.run |
装完后显示:
装完之后记得添加环境变量,使用sudo gedit ~/.bashrc
修改
1 | export CUDA_HOME=/usr/local/cuda |
修改成功后source ~/.bashrc
更新,之后测试。
用nvcc -V
测试一下,终于成功!!!
记得还要测试一下官方sample
1 | cd /usr/local/cuda/samples/1_Utilities/deviceQuery |
1 | ./deviceQuery |
信息如下,终于成功了.
安装cudnn
安装这四个文件,并且必须注册登陆
1 | tar -zxvf cudnn-10.1-linux-x64-v7.6.5.32.tgz |
依次输入以上命令,输入最后一个命令,权限会报错,我没管
1 | sudo dpkg -i libcudnn7_7.6.5.32-1+cuda10.1_amd64.deb |
安装完后测试一下
1 | cp -r /usr/src/cudnn_samples_v7/ ~ |
这里果然报错了,但是是gcc版本问题,需要改软链接
1 | sudo ln -s /usr/bin/gcc-7 /usr/local/cuda/bin/gcc |
之后make
成功,出现以下信息
1 | ./mnistCUDNN |
终于成功,出现Test passed!不容易!
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 锅巴要写编译器!