CUDA9.1在Linux系统下runfile方式安装手册

 

一、准备工作

  1. 确认是CUDA9.1 支持的Linux系统版本


  2. 确认是CUDA9.1 支持的GPU卡

    参考https://developer.nvidia.com/cuda-gpus

3. 确认gcc已安装

输入gcc –version命令,如果有报错信息,需要重新安装gcc

4. 确认安装了正确版本的kernel-devel和kernel-headers

uname –r 查看内核版本,确保安装的kernel-devel和kernel-headers的版本和内核版本一致(Redhat下可以用 rpm –qa|grep kernel)。

5. 下载CUDA

下载链接:https://developer.nvidia.com/cuda-downloads

下图标识是Redhat6 64位的下载示例:


二、安装CUDA

1. 禁用nouveau驱动

先执行命令:lsmod | grep nouveau 如果有返回信息,当前系统中是加载了nouveau驱动模块。

禁用方法:

1.1 Redhat/Centos:

创建文件:/etc/modprobe.d/blacklist-nouveau.conf,在文件中添加以下两行内容:

blacklist nouveau

options nouveau modeset=0

然后执行命令sudo dracut –force

1.2 OpenSuse:

创建文件:/etc/modprobe.d/blacklist-nouveau.conf,在文件中添加以下两行内容:

blacklist nouveau

options nouveau modeset=0

然后执行命令sudo /sbin/mkinitrd

1.3 SLES:

SLES系统中没有安装nouveau驱动,不需要再禁用。

1.4 Ubuntu:

创建文件:/etc/modprobe.d/blacklist-nouveau.conf,在文件中添加以下两行内容:

blacklist nouveau

options nouveau modeset=0

然后执行命令sudo update-initramfs –u

  1. 进入文本模式

设置默认启动方式为文本模式

2.1 Redhat6/Centos6:

编辑inittab,设置成id:3:initdefault:

2.2 Redhat7/Centos7:

执行命令:systemctl set-default multi-user.target

然后重启服务器,进入文本模式

3.    确认Nouveau驱动是否禁用成功

执行lsmod | grep nouveau 如果没有返回信息,说明已经禁用成功。

4. 安装CUDA

4.1执行命令 sudo sh cuda_<version>_linux.run –no-opengl-libs

  • 其中cuda_<version>_linux.run 以下载的cuda安装文件名为准。
  • 关于参数–no-opengl-libs: 如果机器以该GPU卡做显示输出,就不要加这个参数,如果服务器不是用NIVIDA GPU卡做显示输出,一定要加上这个参数,如果不加这个参数,后面安装自动过程中,会有安装nvidia opengl lib的提示,如果选择安装了nividia的 opengl lib,重启后图形化桌面会启动失败。

开始安装后会有几次提示,如果没有特殊需求,默认安装即可:

EULA 协议的接受

CUDA 驱动的安装

CUDA Toolkit 安装, 位置, 和 /usr/local/cuda 符号链接

CUDA Samples安装和位置

4.2 修改默认启动方式为图形化界面启动

4.2.1 Redhat6/Centos6:

编辑inittab,设置成id:5:initdefault:

4.2.2 Redhat7/Centos7:

执行命令:systemctl set-default graphical.target

然后重启进入图形化界面

5.检测device node是否创建成功

在/dev目录下执行ll 查看是否有nvidia开头的文件

6.增加环境变量

编辑/etc/profile文件在末尾追加信息,完成后执行source /etc/profile 即可生效。

6.1 export PATH=/usr/local/cuda-9.1/bin${PATH:+:${PATH}}

6.2 64位系统:

export LD_LIBRARY_PATH=/usr/local/cuda-9.1/lib64\${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

32位系统:

export LD_LIBRARY_PATH=/usr/local/cuda-9.1/lib\${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

三、验证

1.查看驱动版本

执行命令:cat /proc/driver/nvidia/version

2.查看GPU卡信息

执行命令:nividia-smi