如何在調(diào)度任務(wù)中自動(dòng)同步PAI模型至OSS
本文為您介紹如何在調(diào)度任務(wù)中,自動(dòng)同步PAI模型至OSS。
前提條件
在開始執(zhí)行操作之前,請(qǐng)確認(rèn)您已經(jīng)完成以下準(zhǔn)備工作:
已開通OSS并創(chuàng)建OSS Bucket存儲(chǔ)空間,詳情請(qǐng)參見開通OSS服務(wù)和控制臺(tái)快速入門。
已完成OSS訪問授權(quán),詳情請(qǐng)參見云產(chǎn)品依賴與授權(quán):Designer。
自動(dòng)同步Designer模型至OSS
登錄PAI控制臺(tái),并進(jìn)入Designer中已創(chuàng)建的工作流頁面。
以創(chuàng)建心臟病預(yù)測(cè)案例為例,創(chuàng)建及進(jìn)入工作流頁面的操作詳情請(qǐng)參見心臟病預(yù)測(cè)。
在工作流屬性頁簽,將工作流數(shù)據(jù)存儲(chǔ)參數(shù)配置為模型保存的OSS路徑。
選中模型組件(例如邏輯回歸二分類),在右側(cè)的字段設(shè)置頁簽,選中是否生成PMML復(fù)選框。
說明如果模型組件不支持導(dǎo)出PMML格式的模型文件,則可以跳過該步驟,執(zhí)行步驟4。
在模型組件的下游接入通用模型導(dǎo)出組件。
您可以通過通用模型導(dǎo)出組件來指定導(dǎo)出模型文件的名稱。每次執(zhí)行調(diào)度任務(wù)后,都會(huì)在上述步驟配置的OSS路徑下,保存一個(gè)同名的模型文件。
使用DataWorks實(shí)現(xiàn)Designer工作流的離線調(diào)度。具體操作,請(qǐng)參見使用DataWorks離線調(diào)度Designer工作流。
如果您希望每次執(zhí)行調(diào)度任務(wù)后,均生成一個(gè)不同名稱的非臨時(shí)模型文件,可以使用全局變量并結(jié)合定時(shí)調(diào)度參數(shù)來實(shí)現(xiàn),具體請(qǐng)參見高級(jí)功能:全局變量。例如,將日調(diào)度的模型名配置為test_model_${date}。將date參數(shù)在DataWorks調(diào)度配置中替換為$bizdate即可。每次執(zhí)行調(diào)度任務(wù)后,都會(huì)生成以時(shí)間結(jié)尾的模型文件,例如:test_model_20220920。
相關(guān)文檔
Designer預(yù)置了多種算法組件,你可以根據(jù)不同的使用場(chǎng)景選擇合適的組件進(jìn)行模型訓(xùn)練,詳情請(qǐng)參見組件參考:所有組件匯總。
Designer為您提供了豐富的工作流模板,您可以直接套用模板快速構(gòu)建模型,詳情請(qǐng)參見Designer使用案例匯總。