日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

LLM大語言模型端到端鏈路:數(shù)據(jù)處理+模型訓(xùn)練+模型推理

本文介紹如何使用PAI提供的LLM大語言模型數(shù)據(jù)處理組件、訓(xùn)練組件和推理組件,端到端完成大模型的開發(fā)和使用。

前提條件

數(shù)據(jù)集

輸入的訓(xùn)練數(shù)據(jù)需遵循問答對格式,包含以下兩個字段:

  • instruction:問題字段。

  • output:答案字段。

示例如下:

image.png

如果您的數(shù)據(jù)字段名不符合要求,可以提前通過自定義SQL腳本等方式進(jìn)行預(yù)處理。如果您的數(shù)據(jù)直接來自互聯(lián)網(wǎng),可能存在數(shù)據(jù)冗余或臟數(shù)據(jù),可以利用LLM數(shù)據(jù)預(yù)處理組件進(jìn)行初步清洗和整理。具體操作,請參見LLM大語言模型數(shù)據(jù)處理 - github code

使用流程

  1. 進(jìn)入Designer頁面。

    1. 登錄PAI控制臺

    2. 在左側(cè)導(dǎo)航欄單擊工作空間列表,在工作空間列表頁面中單擊待操作的工作空間名稱,進(jìn)入對應(yīng)的工作空間。

    3. 在工作空間頁面的左側(cè)導(dǎo)航欄選擇模型開發(fā)與訓(xùn)練 > 可視化建模(Designer),進(jìn)入Designer頁面。

  2. 構(gòu)建工作流。

    1. 在Designer頁面,單擊預(yù)置模板頁簽。

    2. LLM大語言模型頁簽的LLM大語言模型端到端鏈路:數(shù)據(jù)處理+模型訓(xùn)練+模型推理區(qū)域中,單擊創(chuàng)建

    3. 新建工作流對話框中,配置參數(shù)(可以全部使用默認(rèn)參數(shù)),然后單擊確定

      其中:工作流數(shù)據(jù)存儲配置為OSS Bucket路徑,用于存儲工作流運(yùn)行中產(chǎn)出的臨時數(shù)據(jù)和模型。

    4. 在工作流列表中,雙擊目標(biāo)工作流,進(jìn)入工作流。

    5. 系統(tǒng)根據(jù)預(yù)置的模板,自動構(gòu)建工作流,如下圖所示。image

      區(qū)域

      描述

      進(jìn)行簡單的數(shù)據(jù)預(yù)處理,僅供端到端鏈路演示使用。更詳細(xì)的數(shù)據(jù)預(yù)處理流程,請參見LLM大語言模型數(shù)據(jù)處理 - github code

      進(jìn)行模型訓(xùn)練和離線推理。其中:

      • LLM模型訓(xùn)練組件

        該組件封裝了快速開始(QuickStart)提供的LLM模型,底層計(jì)算基于DLC容器任務(wù)。單擊該組件,在右側(cè)的字段設(shè)置頁簽可以選擇模型名稱。該組件支持多種主流的LLM模型,在本工作流程中,選擇使用qwen-7b-chat模型進(jìn)行示例訓(xùn)練。

      • LLM模型離線推理組件

        使用該組件進(jìn)行離線推理。在本工作流程中,選擇使用qwen-7b-chat模型進(jìn)行離線批量推理。

  3. 單擊畫布上方的運(yùn)行按鈕image,運(yùn)行工作流。

  4. 工作流成功運(yùn)行后,右鍵單擊LLM模型離線推理-1組件,在快捷菜單中選擇查看數(shù)據(jù) > 推理結(jié)果保存目錄(OSS),查看推理結(jié)果。

后續(xù)步驟

您還可以使用經(jīng)過相同預(yù)處理的數(shù)據(jù),同時針對多個模型進(jìn)行訓(xùn)練和推理。例如,構(gòu)建如下工作流來并行地對qwen-7b-chat和llama2-7b-chat兩個模型進(jìn)行微調(diào),然后使用同一批測試數(shù)據(jù)來比較它們推理后生成的結(jié)果。

image