日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

LLM模型訓(xùn)練

LLM模型訓(xùn)練組件支持的LLM模型來(lái)源于PAI的快速開(kāi)始中的部分LLM模型。

使用限制

僅支持DLC計(jì)算引擎。

可視化配置參數(shù)

您可以在Designer中,通過(guò)可視化的方式配置組件參數(shù)。

頁(yè)簽

參數(shù)

是否必選

描述

默認(rèn)值

字段設(shè)置

model_name

模型名稱(chēng)。

無(wú)

訓(xùn)練輸出OSS目錄

如果為空,使用工作空間的默認(rèn)路徑。

無(wú)

訓(xùn)練數(shù)據(jù)路徑

訓(xùn)練數(shù)據(jù)路徑,支持OSS和MaxCompute。如果已經(jīng)連接到其他輸入組件,可不填。數(shù)據(jù)格式請(qǐng)參見(jiàn)示例

無(wú)

驗(yàn)證數(shù)據(jù)路徑

驗(yàn)證數(shù)據(jù)路徑,可選,支持OSS和MaxCompute。如果已經(jīng)連接到其他輸入組件,可不填。數(shù)據(jù)格式請(qǐng)參見(jiàn)示例

無(wú)

參數(shù)設(shè)置

學(xué)習(xí)率

學(xué)習(xí)率。

0.00001

總的訓(xùn)練迭代epoch輪數(shù)

總的訓(xùn)練迭代epoch輪數(shù)。

5

每個(gè)gpu訓(xùn)練batch_size

每個(gè)gpu訓(xùn)練batch_size。

4

最大序列長(zhǎng)度

最大序列長(zhǎng)度。

512

lora_rank

lora_rank。

64

梯度累積步數(shù)

梯度累積步數(shù)。

1

執(zhí)行調(diào)優(yōu)

GPU

選擇用于計(jì)算的GPU的ECS實(shí)例。

無(wú)

最大運(yùn)行時(shí)長(zhǎng)(秒)

算法運(yùn)行的最長(zhǎng)時(shí)間。

無(wú)

相關(guān)文檔