嶺回歸預測組件支持稀疏、稠密兩種數據格式。您可以使用嶺回歸預測組件做數值型變量的預測,包括房價預測、銷售量預測、濕度預測等。本文為您介紹嶺回歸預測組件的配置方法。
使用限制
支持的計算引擎為MaxCompute、Flink或DLC。
算法原理
嶺回歸是一種專用于共線性數據分析的有偏估計回歸方法,實質上是一種改良的最小二乘估計法,通過放棄最小二乘法的無偏性,以損失部分信息、降低精度為代價獲得回歸系數更為符合實際、更可靠的回歸方法,對病態數據的擬合要強于最小二乘法。
可視化配置組件參數
通過代碼方式配置組件
您可以將以下代碼復制到PyAlink腳本組件中,使PyAlink腳本組件實現與該組件相同的功能。
from pyalink.alink import *
def main(sources, sinks, parameter):
model = sources[0]
batchData = sources[1]
predictor = RidgeRegPredictBatchOp()\
.setPredictionCol("pred")
result = predictor.linkFrom(model, batchData)
result.link(sinks[0])
BatchOperator.execute()
文檔內容是否對您有幫助?