博客
关于我
阿里云轻量云GPU服务器配置
阅读量:571 次
发布时间:2019-03-11

本文共 1524 字,大约阅读时间需要 5 分钟。

阿里云的vgn6i轻量云GPU虚拟化服务器是一个性价比极高的选择。虽然不是高性能服务器,但对于仅需调试代码的需求来说,2.445元每小时的费用非常合理。以下是详细的配置和安装步骤。

操作系统配置

  • CPU:Intel® Xeon® Platinum 8163 @ 2.50GHz * 4 vCPUs
  • GPU:1个NVIDIA T4
  • 内存:23GiB
  • 带宽:100Mbps

GPU驱动安装

安装NVIDIA GRID驱动需要以下步骤:

  • 禁用nouveau驱动

    • 查看是否存在 /etc/modprobe.d/blacklist-nouveau.conf,如不存在则创建。
    ls /etc/modprobe.d/blacklist-nouveau.conf

    如果不存在,将以下内容添加到新文件中:

    echo 'blacklist nouveaublacklist lbm-nouveauoptions nouveau modeset=0' > /etc/modprobe.d/blacklist-nouveau.conf
    • 更新initramfs并重启实例:
    rmmod nouveauupdate-initramfs -ureboot
  • 下载并安装GRID驱动

    • 下载对应vgn6i的驱动安装包:
    wget http://grid-9-2.oss-cn-hangzhou.aliyuncs.com/NVIDIA-Linux-x86_64-430.63-grid.run
    • installing:
    chmod +x NVIDIA-Linux-x86_64-430.63-grid.run./NVIDIA-Linux-x86_64-430.63-grid.run
    • 重启后验证GPU驱动状态:
    nvidia-smi
  • 安装Aconda

  • 安装必要依赖项
    sudo apt-get install python3 python3-pip python3-dev git libssl-dev libffi-dev build-essential
  • 下载并安装Aconda
    wget https://repo.anaconda.com/archive/Anaconda3-2020.11-Linux-x86_64.shchmod +x Anaconda3-2020.11-Linux-x86_64.sh./Anaconda3-2020.11-Linux-x86_64.sh
  • 环境配置
    echo 'export PATH="/home/your_user/anaconda3/bin:$PATH"' > ~/.bashrcsource ~/.bashrc
  • 安装PyTorch和TensorFlow

    进入Anaconda终端并安装必要库:

    pip install --upgrade pip setuptoolspip install torch torchvision tf.keras==2.10.0

    创建并进入PyTorch环境:

    conda create -n pytorch3.8-gpu python=3.8source activate pytorch3.8-gpupip install --upgrade pippip install torch torchvision

    验证

    运行以下代码检查GPU支持:

    import torchprint(torch.cuda.is_available())

    确保结果为True,即表示CUDA可用,GPU驱动安装成功。

    通过以上步骤,可在阿里云vgn6i轻量云GPU实例上顺利配置并运行PyTorch,满足机器学习调试需求。

    转载地址:http://cdevz.baihongyu.com/

    你可能感兴趣的文章
    【换行符】什么时候用cin.get()吃掉输入流中的换行符
    查看>>
    【二叉树】已知后序与中序求先序
    查看>>
    数组范围的动态扩容
    查看>>
    如何选择三种验证类型的https证书
    查看>>
    thinkphp使用163/126邮箱发送
    查看>>
    解决Nginx 404 not found问题
    查看>>
    计算机网络之第三章笔记--数据链路层
    查看>>
    创建型模式之简单工厂模式实例及代码操作
    查看>>
    广东外语外贸大学第三届网络安全大赛Writeup
    查看>>
    跟着燕青学分布式事务控制技术方案
    查看>>
    Activiti视频分享
    查看>>
    VS2019 报错: LINK Error 无法找到 MSCOREE.lib的解决办法
    查看>>
    关于JS中的内存溢出与内存泄漏
    查看>>
    Vue——v-model结合值绑定写法
    查看>>
    JS实现防抖与节流(使用按钮触发事件)
    查看>>
    React 学习笔记 —— refs 属性的三种书写方式
    查看>>
    React 学习笔记 —— Fragment
    查看>>
    CCF 模拟2-1 夏令营
    查看>>
    第八届蓝桥杯——杨辉三角
    查看>>
    算法训练——字符串合并
    查看>>