回歸模型評估
回歸模型評估是指基于預測結果和原始結果,評估回歸算法模型的優(yōu)劣性,從而輸出評估指標及殘差直方圖。
組件配置
您可以使用以下任意一種方式,配置回歸模型評估組件參數(shù)。
方式一:可視化方式
在Designer工作流頁面配置組件參數(shù)。
頁簽 | 參數(shù) | 描述 |
字段設置 | 原回歸值 | 支持數(shù)值類型。 |
預測回歸值 | 支持數(shù)值類型。 | |
執(zhí)行調(diào)優(yōu) | 節(jié)點個數(shù) | 與參數(shù)單個節(jié)點內(nèi)存大小搭配使用,取值范圍為1~9999。 |
單個節(jié)點內(nèi)存大小 | 取值范圍為1024 MB~64*1024 MB。 |
方式二:PAI命令方式
使用PAI命令方式,配置該組件參數(shù)。您可以使用SQL腳本組件進行PAI命令調(diào)用,詳情請參見SQL腳本。
PAI -name regression_evaluation -project algo_public
-DinputTableName=input_table
-DyColName=y_col
-DpredictionColName=prediction_col
-DindexOutputTableName=index_output_table
-DresidualOutputTableName=residual_output_table;
參數(shù) | 是否必選 | 參數(shù)描述 | 默認值 |
inputTableName | 是 | 輸入表的名稱。 | 無 |
inputTablePartitions | 否 | 輸入表中,參與計算的分區(qū)。 | 全表 |
yColName | 是 | 輸入表中,原始因變量的列名,支持數(shù)值類型。 | 無 |
predictionColName | 是 | 預測結果中,因變量的列名,支持數(shù)值類型。 | 無 |
indexOutputTableName | 是 | 回歸指標輸出表的名稱。 | 無 |
residualOutputTableName | 是 | 殘差直方圖輸出表的名稱。 | 無 |
intervalNum | 否 | 直方圖區(qū)間數(shù)量。 | 100 |
lifecycle | 否 | 輸出表的生命周期,取值范圍為正整數(shù)。 | 無 |
coreNum | 否 | Instance數(shù)量,取值范圍為1~9999。 | 系統(tǒng)自動設置 |
memSizePerCore | 否 | 每個核心的內(nèi)存,取值范圍為1024 MB~64*1024 MB。 | 系統(tǒng)自動設置 |
組件輸出
回歸指標輸出表的輸出結果為JSON格式,包括以下參數(shù)。
參數(shù) | 描述 |
SST | 總平方和 |
SSE | 誤差平方和 |
SSR | 回歸平方和 |
R2 | 判定系數(shù) |
R | 多重相關系數(shù) |
MSE | 均方誤差 |
RMSE | 均方根誤差 |
MAE | 平均絕對誤差 |
MAD | 平均誤差 |
MAPE | 平均絕對百分誤差 |
count | 行數(shù) |
yMean | 原始因變量的均值 |
predictionMean | 預測結果的均值 |