Lasso回歸預測
更新時間:
Lasso回歸預測組件支持稀疏、稠密兩種數(shù)據(jù)格式。您可以使用該組件做一些數(shù)值型變量的預測,比如貸款額度預測、溫度預測等。本文為您介紹Lasso回歸預測組件的配置方法。
使用限制
支持的計算引擎為MaxCompute、Flink或DLC。
算法原理
Lasso回歸算法通過構造一個懲罰函數(shù),得到一個較為精煉的模型。使得它壓縮一些回歸系數(shù),即強制系數(shù)絕對值之和小于某個固定值,同時設定一些回歸系數(shù)為0。因此保留了子集收縮的優(yōu)點,是一種處理具有復共線性數(shù)據(jù)的有偏估計。
可視化配置組件參數(shù)
輸入樁
輸入樁(從左到右)
數(shù)據(jù)類型
建議上游組件
是否必選
預測輸入模型
無
是
預測輸入數(shù)據(jù)
無
是
組件參數(shù)
頁簽
參數(shù)
描述
字段設置
算法保留列名
選擇算法保留列的名稱。
向量列名
向量列對應的列名稱。
參數(shù)設置
預測結(jié)果列名
預測結(jié)果列的列名稱。
組件多線程線程個數(shù)
組件多線程的線程個數(shù),默認為1。
執(zhí)行調(diào)優(yōu)
節(jié)點個數(shù)
與單個節(jié)點內(nèi)存大小參數(shù)配對使用。取值為[1, 9999]的正整數(shù)。
單個節(jié)點內(nèi)存大小,單位M
取值范圍為1024 MB~64*1024 MB。
通過代碼方式配置組件
您可以將以下代碼復制到PyAlink腳本組件中,使PyAlink腳本組件實現(xiàn)與該組件相同的功能。
from pyalink.alink import *
def main(sources, sinks, parameter):
model = sources[0]
batchData = sources[1]
predictor = LassoRegPredictBatchOp()\
.setPredictionCol("pred")
result = predictor.linkFrom(model, batchData)
result.link(sinks[0])
BatchOperator.execute()
文檔內(nèi)容是否對您有幫助?