通過在DSW中微調和推理ChatGLM-6B模型,實現定制化、高交互性的對話系統。ChatGLM-6B是一個開源的、支持中英雙語的對話語言模型,基于General Language Model (GLM) 架構,具有62億參數。結合模型量化技術,用戶可以在消費級的顯卡上進行本地部署,從而實現更智能、交互性更強的人機對話體驗。
前提條件
操作步驟
步驟一:在DSW中打開教程文件
進入DSW開發環境。
登錄PAI控制臺。
在頁面左上方,選擇DSW實例所在的地域。
在左側導航欄單擊工作空間列表,在工作空間列表頁面中單擊默認工作空間名稱,進入對應工作空間內。
在左側導航欄,選擇模型開發與訓練>交互式建模(DSW)。
單擊需要打開的實例操作列下的打開,進入DSW實例開發環境。
在Notebook頁簽的Launcher頁面,單擊快速開始區域Tool下的DSW Gallery,打開DSW Gallery頁面。
在DSW Gallery頁面中,搜索輕量微調和推理ChatGLM模型實踐,單擊在DSW中打開,即可自動將本教程所需的資源和教程文件下載至DSW實例中,并在下載完成后自動打開教程文件。
步驟二:運行教程文件
在打開的教程文件chatglm_6b_ipynb中,您可以查看教程內容以及直接運行教程。
在教程文件中單擊運行對應步驟的命令,當成功運行結束一個步驟命令后,再順次運行下個步驟的命令。
本教程包括以下4個運行步驟:
下載ChatGLM-6B模型和相關數據
由于ChatGLM數據較大,下載耗時與您所在的地域與網絡環境有關,請耐心等待下載完成。
如果運行后未出現正常返回結果,并出現類似
404 Not Found
的錯誤,請嘗試重新運行下載命令。
微調模型
模型訓練過程有量化過程,訓練時間可能會比較久,請您耐心等待訓練完成。
模型推理
您如果自行安裝推理ChatGLM模型時,執行模型推理前需先檢查推理執行腳本evaluate.sh中的CHECKPOINT參數,確保CHECKPOINT參數取值是訓練保存的路徑名稱。
試玩模型
執行命令后,在返回結果中單擊生成的URL,即可進入WebUI頁面。
說明該URL為內網訪問地址,僅支持在當前的DSW實例內部通過單擊鏈接來訪問WebUI頁面,不支持通過外部瀏覽器直接訪問。
在WebUI頁面,輸入文本內容,單擊Generate,進行模型推理驗證。例如: