日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

準(zhǔn)備加速資源環(huán)境

接入PAI-TorchAcc進(jìn)行訓(xùn)練加速前,您需先準(zhǔn)備滿足規(guī)格要求的訓(xùn)練資源環(huán)境,您可以直接在PAI上開通滿足規(guī)格要求的DSW實(shí)例,或直接使用已有的ECS實(shí)例進(jìn)行訓(xùn)練加速。本文為您介紹接入TorchAcc訓(xùn)練加速的環(huán)境要求。

環(huán)境規(guī)格要求

接入TorchAcc進(jìn)行訓(xùn)練加速時,必須使用GPU類型的實(shí)例,GPU實(shí)例的版本和規(guī)格要求如下。

  • 版本要求

    驅(qū)動

    版本

    CUDA Driver

    11.3及以上版本

    Nvidia Driver

    470及以上版本

  • 規(guī)格要求

    實(shí)例規(guī)格

    是否支持

    V100M16

    支持

    V100M32

    支持

    GU50

    支持

    GU100

    支持

    GU108

    支持

    A10M24

    支持

    關(guān)于實(shí)例規(guī)格的更多詳細(xì)介紹,請參見附錄:公共資源組定價詳情

  • 鏡像要求

    接入TorchAcc進(jìn)行訓(xùn)練加速時,必須使用指定的TorchAcc測試鏡像:registry.<region>.aliyuncs.com/pai-dlc/pai-pytorch-training:torch-1.12-cuda11.3-py38-acc-230219

    說明

    實(shí)際使用時,請將<region>替換為當(dāng)前地域ID,例如:華東2(上海)配置為cn-shanghai,其他地域ID,請參見地域和可用區(qū)

準(zhǔn)備測試環(huán)境

使用DSW環(huán)境

如果您希望在PAI平臺進(jìn)行TorchAcc接入測試,需要按照以下操作步驟創(chuàng)建DSW實(shí)例,并在DSW實(shí)例的Jupyter Notebook中進(jìn)行測試。

  1. 創(chuàng)建專有資源組并按照環(huán)境規(guī)格要求新建資源,具體操作,請參見新建資源組并購買通用計算資源

  2. 進(jìn)入資源組關(guān)聯(lián)的工作空間,創(chuàng)建DSW實(shí)例,其中關(guān)鍵參數(shù)配置如下,更多內(nèi)容請參見創(chuàng)建及管理DSW實(shí)例

    參數(shù)

    描述

    資源配額

    選擇步驟1中已創(chuàng)建的專有資源組。

    • CPU(核數(shù)):配置為30。

    • 內(nèi)存(GB):配置為180。

    • 共享內(nèi)存(GB):配置為100。

    • GPU(卡數(shù)):配置為1。

    選擇鏡像

    鏡像URL頁簽配置鏡像地址:registry.<region>.aliyuncs.com/pai-dlc/pai-pytorch-training:torch-1.12-cuda11.3-py38-acc-230219

    說明

    實(shí)際使用時,請將<region>替換為當(dāng)前地域ID,例如:華東2(上海)配置為cn-shanghai,其他地域ID,請參見地域和可用區(qū)

使用自有ECS實(shí)例

如果您希望使用自有的ECS資源進(jìn)行TorchAcc訓(xùn)練加速,您也可以參考以下步驟準(zhǔn)備好滿足要求的ECS實(shí)例資源。

  1. 購買符合環(huán)境規(guī)格要求的ECS實(shí)例,并安裝好滿足版本要求的Nvidia-smi、CUDA驅(qū)動。購買操作請參見創(chuàng)建實(shí)例,其中:

    • 實(shí)例:選擇ecs.gn6v-c8g1.2xlarge

    • 鏡像:選擇公共鏡像>Alibaba Cloud Linux>Alibaba Cloud Linux 3.2104 LST 64位,選中安裝 GPU驅(qū)動復(fù)選框,并選擇CUDA版本11.4.1>Driver版本470.161.03>CUDNN版本8.2.4

    • 系統(tǒng)盤:建議分配不少于80 GiB的存儲容量。

  2. 在ECS實(shí)例中安裝Docker。具體操作,請參見安裝Docker并使用(Linux)

  3. 安裝NVIDIA Container Toolkit。具體操作,請參見Installing the NVIDIA Container Toolkit

    根據(jù)您的操作系統(tǒng)選擇相應(yīng)的安裝命令,本文使用Yum或Dnf進(jìn)行安裝,安裝完成后重啟Docker daemon。

  4. 使用以下腳本拉起TorchAcc鏡像。

    DOCKER=registry.<region>.aliyuncs.com/pai-dlc/pai-pytorch-training:torch-1.12-cuda11.3-py38-acc-230219
    name=TorchAcc_Tutorials
    
    set -x
    docker run \
        --name $name \
        --rm -it \
        --privileged \
        --ulimit memlock=-1:-1 \
        --gpus all \
        --shm-size 10G \
        -v /dev/shm:/dev/shm \
        --ipc host \
        --network host \
        --rm \
        --cap-add=CAP_SYS_ADMIN \
        -v /path/to/code:/workspace \
        -w /workspace \
        ${DOCKER} bash

    其中:<region>替換為當(dāng)前地域ID,例如:華東2(上海)配置為cn-shanghai,其他地域ID,請參見地域和可用區(qū)