unbuntu14.04-cuda8.0-tensorflow配置安装
安装准备
确保自己的电脑上有nvidia系列的显卡,查看命令
lspci |grep NVIDIA
注意这里最好别用lipci |grep VGA命令,因为有的nvidia显卡系列并不在此命令下显示
本机的nvidia显卡
NVIDIA Corporation GK110GL [Tesla K20c] (rev a1)
NVIDIA Corporation GK110GL [Tesla K20c] (rev a1)
装机的服务器为dell k630 k620
安装ubuntu14.04
关于linux ubuntu的安装在这里不做赘述,需要注意的是,dell k630安装ubuntu最后发现没有图形界面,错误如下:
the system is running in low-graphics mode
这是由于linux安装包自带了nouveau的驱动,它可能和你本机的显卡不兼容,需要禁用了即可,强烈建议不要再给系统装什么图形界面了。
sudo vi /etc/modprobe.d/blacklist.conf
在后面加
blacklist nouveau
重启电脑,图形界面有了,发现电脑的图形运行很慢,因为这时候你并没有安装显卡驱动
这个时候先让你的电脑联网,可以用ubuntu的图形界面配置,也可以pppoeconf直接配置,这里不做赘述。
安装完ubuntu之后主义更新一下源,升级一下现有的程序
sudo apt-get update
sudo apt-get upgrade
然后安装一些必要的插件
sudo apt-get install vim
sudo apt-get install openssh-server(便于你远程登陆)
设置电脑的ubuntu成为静态ip便于以后登陆
vim /etc/network/interfaces
配置你电脑的静态ip(注意你有线是哪个口,然后配置那个口的网口)
比如本机是网口2;
auto eth2
iface eth2 inet static
address 192.168.1.99
netmask 255.255.255.0
network 192.168.1.0
gateway 192.168.1.1
broadcast 192.168.1.255
安装cuda-8.0
cuda-8.0的安装和网上的其它做法不太一样,如果是的显卡是GTX系列的你可以单独安装显卡驱动,我这里显卡是tesla-k20c,所以其中
Install NVIDIA Accelerated Graphics Driver for Linux…?
我这里选的yes(如果你是GTX系列,不妨直接用这个试试,不行在按照其他人的做法),直接用它这里的显卡驱动,实践证明是没有问题的,其余的和网上的做法都一样了。
安装成功后将cuda加入到环境变量中,这里建议加入~/.bashrc文件中,而不用/etc/profile:
export PATH=/usr/local/cuda-8.0/bin${PATH:+:${PATH}} export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
最后可以测试一下自己的cuda
nvidia-smi
测试一下几个nvidia的例子
cd 1_Utilities/deviceQuery
make
./deviceQuery
安装tensorflow
tensorflow安装主要分为源码安装和pip安装,其中最方便的是pip安装,并不建议大家用源码安装,因为还要安装什么brazel,有时候会出错。而且你也不用担心不是源码安装用不了GPU,本人亲测,pip安装方式绝对最快捷的方式。
安装pip
sudo apt-get install python-pip python-dev
主义这里安装后的pip版本很低,升级一下才能找到tensorflow-gpu
sudo pip install pip –upgrade
让其安装0.9+版本的。
之后安装tensorflow就比较方便了,一条命令搞定
sudo pip install tensorflow-gpu
安装cudnn
tar -zxvf cudnn-8.0-…ga.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
如何知道自己tensorflow的gpu是否加速
1:一般情况下,nvidia-smi如果你的显卡在运行,就可以说明 2:有的人发现自己用了cuda后代码并没有提升速度,这是你代码的问题,因为python中有的设置还用的是cpu,tensorflow-gpu加速只是在矩阵运算处,所以有的代码没加速很正常 3:可以测试一个tensorflow的例子 python -m tensorflow.models.image.mnist.convolutional 如果batch的时间<100ms说明是加速的,一般好一点的显卡都是5ms左右,tesla-k20c显卡比较老,一般15ms左右。
tensorflow源码安装
我认为源码安装是比较麻烦的,这里用到brazel,大家最好去官网,百度出来的非常不靠谱
http://www.nvidia.com/object/gpu-accelerated-applications-tensorflow-installation.html
http://www.bazel.io/versions/master/docs/install.html#ubuntu
安装其他module(这些在安装tensorflow之前)
sudo pip install theano sudo pip install numpy sudo pip install scipy sudo pip install sklearn sudo pip install pandas