推薦解決方案-排序的輸入包括經過特征工程處理后的用戶特征表、物品特征表、用戶行為表,輸出為排序模型,可用于模型部署。本文為您介紹推薦解決方案-排序的實現方法。
前提條件
已運行推薦解決方案-特征工程工作流模板生成排序需要的數據集,具體操作請參見特征工程。
rec_sln_demo_user_table_preprocess_all_feature_v2
rec_sln_demo_item_table_preprocess_all_feature_v2
rec_sln_demo_behavior_table_preprocess_v2
實現排序
進入Designer頁面。
登錄PAI控制臺。
在左側導航欄單擊工作空間列表,在工作空間列表頁面中單擊待操作的工作空間名稱,進入對應的工作空間。
在工作空間頁面的左側導航欄選擇 ,進入Designer頁面。
構建工作流。
在Designer頁面,單擊預置模板頁簽。
在模板列表,單擊推薦解決方案-排序區域的創建。
在新建工作流對話框配置參數(可以全部使用默認參數)。
其中: 工作流數據存儲配置為OSS Bucket路徑,用于存儲工作流運行中產出的臨時數據和模型。
單擊確定。您需要等待大約十秒鐘,工作流可以創建成功。
系統根據預置的模板,自動構建工作流,如下圖所示。
組件編號
描述
1
排序模型的樣本。
2
根據fg.json文件,對樣本做FG操作,詳情請參見fg文檔。
3
統計數值類特征的等頻分箱,boundaries用于對數值類特征做離散化。
4
統計枚舉類特征的唯一值數,用于設置模型的embedding_dim和hash_bucket_size。
5
打散rec_sln_demo_sorting模型的30天樣本數據形成訓練樣本。
6
匯總rec_sln_demo_rec_sln_demo_sorting_30d_binning_v2表和rec_sln_demo_rec_sln_demo_sorting_30d_count_v2表結果,計算Feature配置信息和Step配置信息。
7
根據組件編號6節點的計算結果,在EasyRec配置文件中填充配置信息。
說明該節點只需執行一次。
8
模型訓練需先執行一次組件編號7節點,生成EasyRec配置文件。