缺失值填充批預(yù)測
組件實(shí)現(xiàn)缺失值填充功能,填充策略支持最大值、最小值、均值和指定數(shù)值四種。
使用限制
支持的計算引擎為MaxCompute和Flink。
算法簡介
數(shù)據(jù)缺失值填充處理,批式預(yù)測組件。運(yùn)行時需要指定缺失值模型,由缺失值填充訓(xùn)練組件產(chǎn)生。缺失值填充的4種策略,即最大值、最小值、均值、指定數(shù)值,在生成缺失值模型時指定。
可視化配置參數(shù)
【輸入樁配置】
輸入樁(從左到右) | 限制數(shù)據(jù)類型 | 建議上游組件 | 是否必選 |
預(yù)測輸入模型 | 無 | 是 | |
預(yù)測輸入數(shù)據(jù) | 數(shù)值類型 | 是 |
【右側(cè)參數(shù)表單】
頁簽 | 參數(shù) | 描述 |
參數(shù)設(shè)置 | 輸出結(jié)果列列名數(shù)組 | 新生成的列名,設(shè)置的列名個數(shù)需要與缺失值訓(xùn)練時選擇的列數(shù)相同,不設(shè)置時新生成列默認(rèn)替換原始列。 |
組件多線程線程個數(shù) | 組件多線程線程個數(shù),默認(rèn)1。 | |
執(zhí)行調(diào)優(yōu) | 節(jié)點(diǎn)個數(shù) | 與單個節(jié)點(diǎn)內(nèi)存大小參數(shù)配對使用。取值為[1, 9999]的正整數(shù)。 |
單個節(jié)點(diǎn)內(nèi)存大小,單位M | 取值范圍為1024 MB~64*1024 MB。 |
【輸出樁說明】
輸出樁(從左到右) | 存儲位置 | 下游建議組件 | 模型類型 |
輸出結(jié)果 | 不需要配置 | 無 | 無 |
具體示例
您可以將以下代碼復(fù)制到PyAlink腳本組件中,使PyAlink腳本組件實(shí)現(xiàn)與該組件相同的功能。
from pyalink.alink import *
def main(sources, sinks, parameter):
model = sources[0]
data = sources[1]
predictOp = ImputerPredictBatchOp()
result = predictOp.linkFrom(model, data)
result.link(sinks[0])
BatchOperator.execute()
文檔內(nèi)容是否對您有幫助?