swing推薦
swing推薦是swing的批處理預(yù)測組件,您可以使用該組件基于swing訓(xùn)練模型和預(yù)測數(shù)據(jù)進(jìn)行離線預(yù)測。本文為您介紹swing推薦的參數(shù)配置。
使用限制
支持運(yùn)行的計(jì)算資源為MaxCompute和Flink。
組件配置
您可以通過以下任意一種方式,配置swing推薦參數(shù)。
方式一:可視化方式
在Designer工作流頁面配置組件參數(shù)。
頁簽 | 參數(shù)名稱 | 描述 |
字段設(shè)置 | Item列列名 | Item列的名稱。 |
初始推薦列列名 | 初始推薦列的名稱。 | |
算法保留列名 | 算法保留列的名稱。 | |
參數(shù)設(shè)置 | 推薦結(jié)果列名 | 推薦結(jié)果列的名稱。 |
推薦TOP數(shù)量 | 推薦的TOP數(shù)量,默認(rèn)為10。 | |
組件多線程線程個(gè)數(shù) | 組件多線程的線程個(gè)數(shù),默認(rèn)為1。 | |
執(zhí)行調(diào)優(yōu) | 節(jié)點(diǎn)個(gè)數(shù) | 節(jié)點(diǎn)個(gè)數(shù),與參數(shù)單個(gè)節(jié)點(diǎn)內(nèi)存大小配對使用,正整數(shù)。范圍為[1, 9999]。 |
單個(gè)節(jié)點(diǎn)內(nèi)存大小,單位M | 單個(gè)節(jié)點(diǎn)內(nèi)存大小,單位MB,正整數(shù)。范圍[1024, 64*1024]。 |
方式二:Python代碼方式
使用PyAlink腳本組件配置該組件參數(shù)。您可以使用PyAlink腳本組件進(jìn)行Python代碼調(diào)用,詳情請參見PyAlink腳本。
參數(shù)名稱 | 是否必選 | 描述 | 默認(rèn)值 |
itemCol | 是 | Item列的名稱。 | 無 |
recommCol | 是 | 推薦結(jié)果列的名稱。 | 無 |
initRecommCol | 否 | 初始推薦列的名稱。 | 無 |
k | 否 | 推薦的TOP數(shù)量。 | 10 |
reservedCols | 否 | 算法保留列的名稱。 | 無 |
numThreads | 否 | 組件多線程的線程個(gè)數(shù)。 | 1 |
Python代碼方式的使用示例如下。
df_data = pd.DataFrame([
["a1", "11L", 2.2],
["a1", "12L", 2.0],
["a2", "11L", 2.0],
["a2", "12L", 2.0],
["a3", "12L", 2.0],
["a3", "13L", 2.0],
["a4", "13L", 2.0],
["a4", "14L", 2.0],
["a5", "14L", 2.0],
["a5", "15L", 2.0],
["a6", "15L", 2.0],
["a6", "16L", 2.0],
])
data = BatchOperator.fromDataframe(df_data, schemaStr='user string, item string, rating double')
model = SwingTrainBatchOp()\
.setUserCol("user")\
.setItemCol("item")\
.setMinUserItems(1)\
.linkFrom(data)
predictor = SwingRecommBatchOp()\
.setItemCol("item")\
.setRecommCol("prediction_result")
predictor.linkFrom(model, data).print()
使用示例
您可以使用swing推薦組件構(gòu)建如下工作流。本示例中,您需要按照以下流程配置組件:
使用讀數(shù)據(jù)表-1組件讀取測試數(shù)據(jù)集。即配置讀數(shù)據(jù)表組件的表名參數(shù)為存放測試數(shù)據(jù)集的表名,關(guān)于如何獲取測試數(shù)據(jù)集表名,詳情請參見使用示例。
通過swing訓(xùn)練組件構(gòu)建模型。
將測試數(shù)據(jù)集和模型接入swing推薦組件,并配置具體參數(shù),詳情請參見上文的可視化配置組件參數(shù)。