文章都可以转载、引用,标明转载出处即可。

GPU服务器环境部署-Centos7

Linux应用 Mr.c 739℃ 0评论

  上一篇文章写了 Ubuntu系统安装GPU驱动 ,Ubuntu上比较好安装,网上的教程大多也是Ubuntu系统,这里介绍Centos7 系统上使用GPU的安装方式,相对来说centos系统的GPU安装文章就少的可怜了,这也是根据Ubuntu上思路实践。
硬件及系统信息:
  1.普通台式电脑一台;
  2.NVIDIA GeForce GTX 1060 显卡一块;
  3.系统为 CentOS Linux release 7.6.1810 (Core) 最小化安装;
一:环境准备
1.安装内核工具
这里提前将yum替换成了阿里云镜像源。

yum -y install gcc wget kernel-devel  kernel-headers

2.禁用nouveau
为什么要禁用nouveau ?
  nouveau 是一个第三方团队开发的集成显卡驱动,大多数发行版Linux系统都预装,基本能解决nvidia及ATI 的大部分显卡驱动,但是功能比较单一,主要是提供基础的显示功能,并不能满足图像渲染、3D 等支持,所以需要先禁用系统默认的显卡驱动,重启系统释放显卡驱动才能成功安装新的驱动。

vim /etc/modprobe.d/blacklist.conf 
添加blacklist nouveau
vim /lib/modprobe.d/dist-blacklist.conf 添加以下内容
    blacklist nouveau
    options nouveau modeset=0
mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r)-nouveau.img
dracut /boot/initramfs-$(uname -r).img $(uname -r)

  initramfs-xxx.img 是伪根系统,里面装载了设备的硬件驱动,系统启动的时候会先加载这个文件获取磁盘等硬件的驱动信息,驱动信息获取到了才可以挂载磁盘等操作,所以默认预装的nouveau 显卡驱动也是在这里面,在系统中禁用后需要重新生成一个新的img 文件用于系统,这样在启动的时候自然就不会再加载nouveau驱动了。

reboot   #重启系统加载新驱动

二:安装驱动
  到NVIDIA官方下载对应显卡型号的Linux 64位驱动程序 https://www.nvidia.cn/Download/index.aspx?lang=cn
显卡型号可以通过命令获取:

lspci | grep -i vga

1.安装NVIDIA驱动

./NVIDIA-Linux-x86_64-440.64.run

  如果提示Unable to find the kernel source tree for the currently running kernel …… 则安装命令改为(具体目录根据实际情况填写):

./NVIDIA-Linux-x86_64-440.64.run --kernel-source-path=/usr/src/kernels/3.10.0-1062.12.1.el7.x86_64 -k $(uname -r)

安装过程不安装32位兼容程序
提示 Unable to load the ‘nvidia-drm’ kernel module. 不用管。

建议都下载run包,有部分显卡驱动官方提供了rpm包,rpm包有可能会有问题。
2.验证显卡驱动是否成功
[root@gpu-centos ~]# nvidia-smi
Thu Mar 5 17:18:34 2020
+—————————————————————————–+
| NVIDIA-SMI 440.64 Driver Version: 440.64 CUDA Version: 10.2 |
|——————————-+———————-+———————-+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 GeForce GTX 106… Off | 00000000:01:00.0 Off | N/A |
| 35% 25C P8 4W / 120W | 15MiB / 3019MiB | 0% Default |
+——————————-+———————-+———————-+

+—————————————————————————–+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
|
+—————————————————————————–+
三:安装xorg组件
1.安装xorg组件

yum install -y xorg-x11-xauth xorg-x11-server-Xorg xorg-x11-utils xorg-x11-xinit freeglut mesa-libGL-devel mesa-libGLU-devel  glx-utils  supervisor

2.生成xorg配置文件,跟上篇文章一样
物理机可使用nvidia-xconfig命令生成
GPU云服使用Xorg命令生成配置文件:

Xorg :0 -configure
cp xorg.conf.new /etc/X11/xorg.conf

3.启动xorg验证

export DISPLAY=:0
/usr/bin/Xorg :0 &
glxinfo | grep -i opengl

还是一样的,使用glxinfo命令,有opengl相关信息输出代表环境安装正确。
测试都正常后将export DISPLAY=:0 写入/etc/profie中,并配置supervisor启动xorg

cat /etc/supervisord.d/xorg.conf 
[program:Xorg0]
command=/usr/bin/Xorg :0
autorestart=true

转载请注明:菜鸟运维网 » GPU服务器环境部署-Centos7

喜欢 (3)
发表我的评论
取消评论

表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址