評分卡預測組件對原始數據根據評分卡訓練組件產出的模型結果進行預測打分。
組件配置
您可以使用以下任意一種方式,配置評分卡預測組件參數。
方式一:可視化方式
在Designer工作流頁面配置組件參數。
頁簽 | 參數 | 描述 |
字段設置 | 特征列 | 選擇用于預測的原始特征列,默認選擇全部。 |
原樣添加到結果表 | 選擇不進行任何處理,直接附加到預測結果表中的列。例如ID列和目標列等。 | |
輸出變量分 | 是否輸出每個特征變量所對應的分數,最終的預測總得分為截距項的得分加所有的變量分。 | |
執行調優 | 核數目 | 使用的CPU Core數量,默認系統自動分配。 |
每個核的內存大小 | 每個CPU Core所用的內存大小,默認系統自動分配。 |
方式二:PAI命令方式
使用PAI命令方式,配置該組件參數。您可以使用SQL腳本組件進行PAI命令調用,詳情請參見SQL腳本。
pai -name=lm_predict
-project=algo_public
-DinputFeatureTableName=input_data_table
-DinputModelTableName=input_model_table
-DmetaColNames=sample_key,label
-DfeatureColNames=fea1,fea2
-DoutputTableName=output_score_table
參數 | 描述 | 是否必選 | 默認值 |
inputFeatureTableName | 輸入特征數據表。 | 是 | 無 |
inputFeatureTablePartitions | 輸入特征表選擇的分區。 | 否 | 全表 |
inputModelTableName | 輸入的模型表。 | 是 | 無 |
featureColNames | 輸入表選擇的特征列。 | 否 | 所有列 |
metaColNames | 不進行轉換的數據列,選中的列會原樣輸出??梢栽诖酥付↙abel和sample_id等。 | 否 | 無 |
outputFeatureScore | 預測結果中是否輸出變量分,取值包括:
| 否 | false |
outputTableName | 輸出預測結果表。 | 是 | 無 |
lifecycle | 輸出表的生命周期。 | 否 | 無 |
coreNum | 核心數。 | 否 | 默認自動計算 |
memSizePerCore | 內存大小,單位為MB。 | 否 | 默認自動計算 |
組件輸出
評分卡預測組件輸出的打分表示例如下。其中churn列為用戶選擇的原樣添加到結果表中的列,與預測結果無關。其它三列為預測結果列,其含義如下表所示。
列名 | 列類型 | 列描述 |
prediction_score | DOUBLE | 預測分數列。線性模型中特征值和模型權重值直接相乘相加的結果,對應到評分卡模型中,如果模型進行了分數轉換,則該分數輸出轉換后的得分。 |
prediction_prob | DOUBLE | 二分類場景中預測得到的正例概率值,原始得分(未經分數轉換)經過Sigmoid變換后得到該值。 |
prediction_detail | STRING | 用JSON格式描述的各類別概率值,其中0表示負類,1表示正類。例如{“0”:0.1813110520,”1”:0.8186889480}。 |