LLM模型訓(xùn)練
LLM模型訓(xùn)練組件支持的LLM模型來(lái)源于PAI的快速開(kāi)始中的部分LLM模型。
使用限制
僅支持DLC計(jì)算引擎。
可視化配置參數(shù)
您可以在Designer中,通過(guò)可視化的方式配置組件參數(shù)。
頁(yè)簽 | 參數(shù) | 是否必選 | 描述 | 默認(rèn)值 |
字段設(shè)置 | model_name | 是 | 模型名稱(chēng)。 | 無(wú) |
訓(xùn)練輸出OSS目錄 | 否 | 如果為空,使用工作空間的默認(rèn)路徑。 | 無(wú) | |
訓(xùn)練數(shù)據(jù)路徑 | 否 | 訓(xùn)練數(shù)據(jù)路徑,支持OSS和MaxCompute。如果已經(jīng)連接到其他輸入組件,可不填。數(shù)據(jù)格式請(qǐng)參見(jiàn)示例。 | 無(wú) | |
驗(yàn)證數(shù)據(jù)路徑 | 否 | 驗(yàn)證數(shù)據(jù)路徑,可選,支持OSS和MaxCompute。如果已經(jīng)連接到其他輸入組件,可不填。數(shù)據(jù)格式請(qǐng)參見(jiàn)示例。 | 無(wú) | |
參數(shù)設(shè)置 | 學(xué)習(xí)率 | 是 | 學(xué)習(xí)率。 | 0.00001 |
總的訓(xùn)練迭代epoch輪數(shù) | 是 | 總的訓(xùn)練迭代epoch輪數(shù)。 | 5 | |
每個(gè)gpu訓(xùn)練batch_size | 是 | 每個(gè)gpu訓(xùn)練batch_size。 | 4 | |
最大序列長(zhǎng)度 | 是 | 最大序列長(zhǎng)度。 | 512 | |
lora_rank | 是 | lora_rank。 | 64 | |
梯度累積步數(shù) | 是 | 梯度累積步數(shù)。 | 1 | |
執(zhí)行調(diào)優(yōu) | GPU | 否 | 選擇用于計(jì)算的GPU的ECS實(shí)例。 | 無(wú) |
最大運(yùn)行時(shí)長(zhǎng)(秒) | 否 | 算法運(yùn)行的最長(zhǎng)時(shí)間。 | 無(wú) |
相關(guān)文檔
關(guān)于Designer組件更詳細(xì)的內(nèi)容介紹,請(qǐng)參見(jiàn)Designer概述。
更多關(guān)于LLM模型的說(shuō)明,請(qǐng)參見(jiàn)快速開(kāi)始(QuickStart)。