2020-09-22
python, bug, tenserflow, 机器学习, cuda
问题描述
在安装好tensorflow、cuda和cudnn后,在python中import tensorflow时仍然发生报错:
原因
这里是cuda版本不对的问题,我安装的是11.0版本,而需要的是10.1,所以在安装tensorflow之前,一定要确认tensorflow和cuda版本的对应!!
踩坑
cuda安装时选择了network
网络版本
安装好后看看软件包里有什么版本:
发现都是11.0版本我安的明明是10.1deb包,你给我安11.0,这不坑人吗
- 卸载cuda在看看是否卸载干净了
1
2sudo apt remove --purge cuda
sudo apt autoremovels /usr/local/|grep cuda
:
还剩下一个cuda-11.0
文件夹,原来的cuda
软连接已经没有了,再看看这个文件夹里还剩啥tree /usr/local/cuda-11.0
:
这些不是之前复制的cudnn的文件吗?那直接删掉就好sudo rm -rf /usr/local/cuda-11.0
再看看还有没有剩的,输入dpkg --get-selections |grep cuda
查看:
显示deinstall
说明还有配置文件残留,一个个清除即可:
1 | sudo dpkg -P cuda-cudart-11-0 |
好了,这次是彻彻底底删完了!
- 安装cuda10.1
一定不能选择network
版!!其它教程也有选择runfile(local)
,似乎也行
下载完成后,在下载的目录下执行:下载开始前会有个确认的输入,这里先看看安装的包是不是10.1的1
2
3sudo dpkg -i cuda-repo-ubuntu1804-10-1-local-10.1.105-418.39_1.0-1_amd64.deb
sudo apt update
sudo apt install cuda
然后环境变量就不说了,配置方法没有变,可以看ubuntu pip安装tensorflow-gpu